前言
如果在文中用詞或者理解方面出現問題,歡迎指出。此文旨在提及而不深究,但會盡量效率地把知識點都拋出來
#一、JVM的基本介紹
JVM 是 JAVA Virtual machine 的縮寫,它是一個虛構出來的計算機,一種規范。通過在實際的計算機上仿真模擬各類計算機功能實現···
好,其實拋開這么專業的句子不說,就知道JVM其實就類似于一臺小電腦運行在windows或者linux這些操作系統環境下即可。它直接和操作系統進行交互,與硬件不直接交互,而操作系統可以幫我們完成和硬件進行交互的工作。
#1.1 Java文件是如何被運行的
1.1 Java文件是如何被運行的
比如我們現在寫了一個 HelloWorld.java 好了,那這個 HelloWorld.java 拋開所有東西不談,那是不是就類似于一個文本文件,只是這個文本文件它寫的都是英文,而且有一定的縮進而已。
那我們的 JVM 是不認識文本文件的,所以它需要一個 編譯 ,讓其成為一個它會讀二進制文件的 HelloWorld.class
#① 類加載器
如果 JVM 想要執行這個 .class 文件,我們需要將其裝進一個 類加載器 中,它就像一個搬運工一樣,會把所有的 .class 文件全部搬進JVM里面來。
② 方法區
方法區 是用于存放類似于元數據信息方面的數據的,比如類信息,常量,靜態變量,編譯后代碼···等
類加載器將 .class 文件搬過來就是先丟到這一塊上
#③ 堆
堆 主要放了一些存儲的數據,比如對象實例,數組···等,它和方法區都同屬于 線程共享區域 。也就是說它們都是 線程不安全 的
#④ 棧
棧 這是我們的代碼運行空間。我們編寫的每一個方法都會放到 棧 里面運行。
我們會聽說過 本地方法棧 或者 本地方法接口 這兩個名詞,不過我們基本不會涉及這兩塊的內容,它倆底層是使用C來進行工作的,和Java沒有太大的關系。
#⑤ 程序計數器
主要就是完成一個加載工作,類似于一個指針一樣的,指向下一行我們需要執行的代碼。和棧一樣,都是 線程獨享 的,就是說每一個線程都會有自己對應的一塊區域而不會存在并發和多線程的問題。
小總結
- Java文件經過編譯后變成 .class 字節碼文件
- 字節碼文件通過類加載器被搬運到 JVM 虛擬機中
- 虛擬機主要的5大塊:方法區,堆都為線程共享區域,有線程安全問題,棧和本地方法棧和計數器都是獨享區域,不存在線程安全問題,而 JVM 的調優主要就是圍繞堆,棧兩大塊進行
#1.2 簡單的代碼例子
一個簡單的學生類
一個main方法
執行main方法的步驟如下:
- 編譯好 App.java 后得到 App.class 后,執行 App.class,系統會啟動一個 JVM 進程,從 classpath 路徑中找到一個名為 App.class 的二進制文件,將 App 的類信息加載到運行時數據區的方法區內,這個過程叫做 App 類的加載
- JVM 找到 App 的主程序入口,執行main方法
- 這個main中的第一條語句為 Student student = new Student("tellUrDream") ,就是讓 JVM 創建一個Student對象,但是這個時候方法區中是沒有 Student 類的信息的,所以 JVM 馬上加載 Student 類,把 Student 類的信息放到方法區中
- 加載完 Student 類后,JVM 在堆中為一個新的 Student 實例分配內存,然后調用構造函數初始化 Student 實例,這個 Student 實例持有 指向方法區中的 Student 類的類型信息 的引用
- 執行student.sayName();時,JVM 根據 student 的引用找到 student 對象,然后根據 student 對象持有的引用定位到方法區中 student 類的類型信息的方法表,獲得 sayName() 的字節碼地址。
- 執行sayName()
其實也不用管太多,只需要知道對象實例初始化時會去方法區中找類信息,完成后再到棧那里去運行方法。找方法就在方法表中找。
#二、類加載器的介紹
之前也提到了它是負責加載.class文件的,它們在文件開頭會有特定的文件標示,將class文件字節碼內容加載到內存中,并將這些內容轉換成方法區中的運行時數據結構,并且ClassLoader只負責class文件的加載,而是否能夠運行則由 Execution Engine 來決定
#2.1 類加載器的流程
從類被加載到虛擬機內存中開始,到釋放內存總共有7個步驟:加載,驗證,準備,解析,初始化,使用,卸載。其中驗證,準備,解析三個部分統稱為連接
#2.1.1 加載
- 將class文件加載到內存
- 將靜態數據結構轉化成方法區中運行時的數據結構
- 在堆中生成一個代表這個類的 java.lang.Class對象作為數據訪問的入口
#2.1.2 鏈接
- 驗證:確保加載的類符合 JVM 規范和安全,保證被校驗類的方法在運行時不會做出危害虛擬機的事件,其實就是一個安全檢查
- 準備:為static變量在方法區中分配內存空間,設置變量的初始值,例如 static int a = 3 (注意:準備階段只設置類中的靜態變量(方法區中),不包括實例變量(堆內存中),實例變量是對象初始化時賦值的)
- 解析:虛擬機將常量池內的符號引用替換為直接引用的過程(符號引用比如我現在import java.util.ArrayList這就算符號引用,直接引用就是指針或者對象地址,注意引用對象一定是在內存進行)
#2.1.3 初始化
初始化其實就是執行類構造器方法的<clinit>()的過程,而且要保證執行前父類的<clinit>()方法執行完畢。這個方法由編譯器收集,順序執行所有類變量(static修飾的成員變量)顯式初始化和靜態代碼塊中語句。此時準備階段時的那個 static int a 由默認初始化的0變成了顯式初始化的3。 由于執行順序緣故,初始化階段類變量如果在靜態代碼塊中又進行了更改,會覆蓋類變量的顯式初始化,最終值會為靜態代碼塊中的賦值。
注意:字節碼文件中初始化方法有兩種,非靜態資源初始化的<init>和靜態資源初始化的<clinit>,類構造器方法<clinit>()不同于類的構造器,這些方法都是字節碼文件中只能給JVM識別的特殊方法。
#2.1.4 卸載
GC將無用對象從內存中卸載
#2.2 類加載器的加載順序
加載一個Class類的順序也是有優先級的,類加載器從最底層開始往上的順序是這樣的
- BootStrap ClassLoader:rt.jar
- Extension ClassLoader: 加載擴展的jar包
- App ClassLoader:指定的classpath下面的jar包
- Custom ClassLoader:自定義的類加載器
#2.3 雙親委派機制
當一個類收到了加載請求時,它是不會先自己去嘗試加載的,而是委派給父類去完成,比如我現在要 new 一個 Person,這個 Person 是我們自定義的類,如果我們要加載它,就會先委派 App ClassLoader ,只有當父類加載器都反饋自己無法完成這個請求(也就是父類加載器都沒有找到加載所需的 Class)時,子類加載器才會自行嘗試加載。
這樣做的好處是,加載位于 rt.jar 包中的類時不管是哪個加載器加載,最終都會委托到 BootStrap ClassLoader 進行加載,這樣保證了使用不同的類加載器得到的都是同一個結果。
其實這個也是一個隔離的作用,避免了我們的代碼影響了 JDK 的代碼,比如我現在自己定義一個 java.lang.String :
package java.lang;
public class String {
public static void main(String[] args) {
System.out.println();
}
}
嘗試運行當前類的 main 函數的時候,我們的代碼肯定會報錯。這是因為在加載的時候其實是找到了 rt.jar 中的java.lang.String,然而發現這個里面并沒有 main 方法。
#三、運行時數據區
#3.1 本地方法棧和程序計數器
比如說我們現在點開Thread類的源碼,會看到它的start0方法帶有一個native關鍵字修飾,而且不存在方法體,這種用native修飾的方法就是本地方法,這是使用C來實現的,然后一般這些方法都會放到一個叫做本地方法棧的區域。
程序計數器其實就是一個指針,它指向了我們程序中下一句需要執行的指令,它也是內存區域中唯一一個不會出現OutOfMemoryError的區域,而且占用內存空間小到基本可以忽略不計。這個內存僅代表當前線程所執行的字節碼的行號指示器,字節碼解析器通過改變這個計數器的值選取下一條需要執行的字節碼指令。
如果執行的是native方法,那這個指針就不工作了。
#3.2 方法區
方法區主要的作用是存放類的元數據信息,常量和靜態變量···等。當它存儲的信息過大時,會在無法滿足內存分配時報錯。
#3.3 虛擬機棧和虛擬機堆
一句話便是:棧管運行,堆管存儲。則虛擬機棧負責運行代碼,而虛擬機堆負責存儲數據。
#3.3.1 虛擬機棧的概念
它是Java方法執行的內存模型。里面會對局部變量,動態鏈表,方法出口,棧的操作(入棧和出棧)進行存儲,且線程獨享。同時如果我們聽到局部變量表,那也是在說虛擬機棧
public class Person{
int a = 1;
public void doSomething(){
int b = 2;
}
}
#3.3.2 虛擬機棧存在的異常
如果線程請求的棧的深度大于虛擬機棧的最大深度,就會報 StackOverflowError (這種錯誤經常出現在遞歸中)。Java虛擬機也可以動態擴展,但隨著擴展會不斷地申請內存,當無法申請足夠內存時就會報錯 OutOfMemoryError。
#3.3.3 虛擬機棧的生命周期
對于棧來說,不存在垃圾回收。只要程序運行結束,棧的空間自然就會釋放了。棧的生命周期和所處的線程是一致的。
這里補充一句:8種基本類型的變量+對象的引用變量+實例方法都是在棧里面分配內存。
#3.3.4 虛擬機棧的執行
我們經常說的棧幀數據,說白了在JVM中叫棧幀,放到Java中其實就是方法,它也是存放在棧中的。
棧中的數據都是以棧幀的格式存在,它是一個關于方法和運行期數據的數據集。比如我們執行一個方法a,就會對應產生一個棧幀A1,然后A1會被壓入棧中。同理方法b會有一個B1,方法c會有一個C1,等到這個線程執行完畢后,棧會先彈出C1,后B1,A1。它是一個先進后出,后進先出原則。
#3.3.5 局部變量的復用
局部變量表用于存放方法參數和方法內部所定義的局部變量。它的容量是以Slot為最小單位,一個slot可以存放32位以內的數據類型。
虛擬機通過索引定位的方式使用局部變量表,范圍為[0,局部變量表的slot的數量]。方法中的參數就會按一定順序排列在這個局部變量表中,至于怎么排的我們可以先不關心。而為了節省棧幀空間,這些slot是可以復用的,當方法執行位置超過了某個變量,那么這個變量的slot可以被其它變量復用。當然如果需要復用,那我們的垃圾回收自然就不會去動這些內存。
#3.3.6 虛擬機堆的概念
JVM內存會劃分為堆內存和非堆內存,堆內存中也會劃分為年輕代和老年代,而非堆內存則為永久代。年輕代又會分為Eden和Survivor區。Survivor也會分為FromPlace和ToPlace,toPlace的survivor區域是空的。Eden,FromPlace和ToPlace的默認占比為 8:1:1。當然這個東西其實也可以通過一個 -XX:+
UsePSAdaptiveSurvivorSizePolicy 參數來根據生成對象的速率動態調整
堆內存中存放的是對象,垃圾收集就是收集這些對象然后交給GC算法進行回收。非堆內存其實我們已經說過了,就是方法區。在1.8中已經移除永久代,替代品是一個元空間(MetaSpace),最大區別是metaSpace是不存在于JVM中的,它使用的是本地內存。并有兩個參數
MetaspaceSize:初始化元空間大小,控制發生GC
MaxMetaspaceSize:限制元空間大小上限,防止占用過多物理內存。
移除的原因可以大致了解一下:融合HotSpot JVM和JRockit VM而做出的改變,因為JRockit是沒有永久代的,不過這也間接性地解決了永久代的OOM問題。
#3.3.7 Eden年輕代的介紹
當我們new一個對象后,會先放到Eden劃分出來的一塊作為存儲空間的內存,但是我們知道對堆內存是線程共享的,所以有可能會出現兩個對象共用一個內存的情況。這里JVM的處理是每個線程都會預先申請好一塊連續的內存空間并規定了對象存放的位置,而如果空間不足會再申請多塊內存空間。這個操作我們會稱作TLAB,有興趣可以了解一下。
當Eden空間滿了之后,會觸發一個叫做Minor GC(就是一個發生在年輕代的GC)的操作,存活下來的對象移動到Survivor0區。Survivor0區滿后觸發 Minor GC,就會將存活對象移動到Survivor1區,此時還會把from和to兩個指針交換,這樣保證了一段時間內總有一個survivor區為空且to所指向的survivor區為空。經過多次的 Minor GC后仍然存活的對象(這里的存活判斷是15次,對應到虛擬機參數為 -XX:MaxTenuringThreshold 。為什么是15,因為HotSpot會在對象投中的標記字段里記錄年齡,分配到的空間僅有4位,所以最多只能記錄到15)會移動到老年代。老年代是存儲長期存活的對象的,占滿時就會觸發我們最常聽說的Full GC,期間會停止所有線程等待GC的完成。所以對于響應要求高的應用應該盡量去減少發生Full GC從而避免響應超時的問題。
而且當老年區執行了full gc之后仍然無法進行對象保存的操作,就會產生OOM,這時候就是虛擬機中的堆內存不足,原因可能會是堆內存設置的大小過小,這個可以通過參數-Xms、-Xmx來調整。也可能是代碼中創建的對象大且多,而且它們一直在被引用從而長時間垃圾收集無法收集它們。
補充說明:關于-XX:TargetSurvivorRatio參數的問題。其實也不一定是要滿足-XX:MaxTenuringThreshold才移動到老年代。可以舉個例子:如對象年齡5的占30%,年齡6的占36%,年齡7的占34%,加入某個年齡段(如例子中的年齡6)后,總占用超過Survivor空間*TargetSurvivorRatio的時候,從該年齡段開始及大于的年齡對象就要進入老年代(即例子中的年齡6對象,就是年齡6和年齡7晉升到老年代),這時候無需等到MaxTenuringThreshold中要求的15
#3.3.8 如何判斷一個對象需要被干掉
圖中程序計數器、虛擬機棧、本地方法棧,3個區域隨著線程的生存而生存的。內存分配和回收都是確定的。隨著線程的結束內存自然就被回收了,因此不需要考慮垃圾回收的問題。而Java堆和方法區則不一樣,各線程共享,內存的分配和回收都是動態的。因此垃圾收集器所關注的都是堆和方法這部分內存。
在進行回收前就要判斷哪些對象還存活,哪些已經死去。下面介紹兩個基礎的計算方法
1.引用計數器計算:給對象添加一個引用計數器,每次引用這個對象時計數器加一,引用失效時減一,計數器等于0時就是不會再次使用的。不過這個方法有一種情況就是出現對象的循環引用時GC沒法回收。
2.可達性分析計算:這是一種類似于二叉樹的實現,將一系列的GC ROOTS作為起始的存活對象集,從這個節點往下搜索,搜索所走過的路徑成為引用鏈,把能被該集合引用到的對象加入到集合中。搜索當一個對象到GC Roots沒有使用任何引用鏈時,則說明該對象是不可用的。主流的商用程序語言,例如Java,C#等都是靠這招去判定對象是否存活的。
(了解一下即可)在Java語言匯總能作為GC Roots的對象分為以下幾種:
- 虛擬機棧(棧幀中的本地方法表)中引用的對象(局部變量)
- 方法區中靜態變量所引用的對象(靜態變量)
- 方法區中常量引用的對象
- 本地方法棧(即native修飾的方法)中JNI引用的對象(JNI是Java虛擬機調用對應的C函數的方式,通過JNI函數也可以創建新的Java對象。且JNI對于對象的局部引用或者全局引用都會把它們指向的對象都標記為不可回收)
- 已啟動的且未終止的Java線程
這種方法的優點是能夠解決循環引用的問題,可它的實現需要耗費大量資源和時間,也需要GC(它的分析過程引用關系不能發生變化,所以需要停止所有進程)
#3.3.9 如何宣告一個對象的真正死亡
首先必須要提到的是一個名叫 finalize() 的方法
finalize()是Object類的一個方法、一個對象的finalize()方法只會被系統自動調用一次,經過finalize()方法逃脫死亡的對象,第二次不會再調用。
補充一句:并不提倡在程序中調用finalize()來進行自救。建議忘掉Java程序中該方法的存在。因為它執行的時間不確定,甚至是否被執行也不確定(Java程序的不正常退出),而且運行代價高昂,無法保證各個對象的調用順序(甚至有不同線程中調用)。在Java9中已經被標記為 deprecated ,且 java.lang.ref.Cleaner(也就是強、軟、弱、幻象引用的那一套)中已經逐步替換掉它,會比 finalize 來的更加的輕量及可靠。
判斷一個對象的死亡至少需要兩次標記
- 如果對象進行可達性分析之后沒發現與GC Roots相連的引用鏈,那它將會第一次標記并且進行一次篩選。判斷的條件是決定這個對象是否有必要執行finalize()方法。如果對象有必要執行finalize()方法,則被放入F-Queue隊列中。
- GC對F-Queue隊列中的對象進行二次標記。如果對象在finalize()方法中重新與引用鏈上的任何一個對象建立了關聯,那么二次標記時則會將它移出“即將回收”集合。如果此時對象還沒成功逃脫,那么只能被回收了。
如果確定對象已經死亡,我們又該如何回收這些垃圾呢
#3.4 垃圾回收算法
不會非常詳細的展開,常用的有標記清除,復制,標記整理和分代收集算法
#3.4.1 標記清除算法
標記清除算法就是分為“標記”和“清除”兩個階段。標記出所有需要回收的對象,標記結束后統一回收。這個套路很簡單,也存在不足,后續的算法都是根據這個基礎來加以改進的。
其實它就是把已死亡的對象標記為空閑內存,然后記錄在一個空閑列表中,當我們需要new一個對象時,內存管理模塊會從空閑列表中尋找空閑的內存來分給新的對象。
不足的方面就是標記和清除的效率比較低下。且這種做法會讓內存中的碎片非常多。這個導致了如果我們需要使用到較大的內存塊時,無法分配到足夠的連續內存。比如下圖
此時可使用的內存塊都是零零散散的,導致了剛剛提到的大內存對象問題
#3.4.2 復制算法
為了解決效率問題,復制算法就出現了。它將可用內存按容量劃分成兩等分,每次只使用其中的一塊。和survivor一樣也是用from和to兩個指針這樣的玩法。fromPlace存滿了,就把存活的對象copy到另一塊toPlace上,然后交換指針的內容。這樣就解決了碎片的問題。
這個算法的代價就是把內存縮水了,這樣堆內存的使用效率就會變得十分低下了
不過它們分配的時候也不是按照1:1這樣進行分配的,就類似于Eden和Survivor也不是等價分配是一個道理。
#3.4.3 標記整理算法
復制算法在對象存活率高的時候會有一定的效率問題,標記過程仍然與“標記-清除”算法一樣,但后續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然后直接清理掉邊界以外的內存
3.4.4 分代收集算法
這種算法并沒有什么新的思想,只是根據對象存活周期的不同將內存劃分為幾塊。一般是把Java堆分為新生代和老年代,這樣就可以根據各個年代的特點采用最適當的收集算法。在新生代中,每次垃圾收集時都發現有大批對象死去,只有少量存活,那就選用復制算法,只需要付出少量存活對象的復制成本就可以完成收集。而老年代中因為對象存活率高、沒有額外空間對它進行分配擔保,就必須使用“標記-清理”或者“標記-整理”算法來進行回收。
說白了就是八仙過海各顯神通,具體問題具體分析了而已。
#3.5 (了解)各種各樣的垃圾回收器
HotSpot VM中的垃圾回收器,以及適用場景
到jdk8為止,默認的垃圾收集器是Parallel Scavenge 和 Parallel Old
從jdk9開始,G1收集器成為默認的垃圾收集器 目前來看,G1回收器停頓時間最短而且沒有明顯缺點,非常適合Web應用。在jdk8中測試Web應用,堆內存6G,新生代4.5G的情況下,Parallel Scavenge 回收新生代停頓長達1.5秒。G1回收器回收同樣大小的新生代只停頓0.2秒。
#3.6 (了解)JVM的常用參數
JVM的參數非常之多,這里只列舉比較重要的幾個,通過各種各樣的搜索引擎也可以得知這些信息。
參數名稱 |
含義 |
默認值 |
說明 |
-Xms |
初始堆大小 |
物理內存的1/64(<1GB) |
默認(MinHeapFreeRatio參數可以調整)空余堆內存小于40%時,JVM就會增大堆直到-Xmx的最大限制. |
-Xmx |
最大堆大小 |
物理內存的1/4(<1GB) |
默認(MaxHeapFreeRatio參數可以調整)空余堆內存大于70%時,JVM會減少堆直到 -Xms的最小限制 |
-Xmn |
年輕代大小(1.4or later) |
|
注意:此處的大小是(eden+ 2 survivor space).與jmap -heap中顯示的New gen是不同的。整個堆大小=年輕代大小 + 老年代大小 + 持久代(永久代)大小.增大年輕代后,將會減小年老代大小.此值對系統性能影響較大,Sun官方推薦配置為整個堆的3/8 |
-XX:NewSize |
設置年輕代大小(for 1.3/1.4) |
|
|
-XX:MaxNewSize |
年輕代最大值(for 1.3/1.4) |
|
|
-XX:PermSize |
設置持久代(perm gen)初始值 |
物理內存的1/64 |
|
-XX:MaxPermSize |
設置持久代最大值 |
物理內存的1/4 |
|
-Xss |
每個線程的堆棧大小 |
|
JDK5.0以后每個線程堆棧大小為1M,以前每個線程堆棧大小為256K.根據應用的線程所需內存大小進行 調整.在相同物理內存下,減小這個值能生成更多的線程.但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右一般小的應用, 如果棧不是很深, 應該是128k夠用的 大的應用建議使用256k。這個選項對性能影響比較大,需要嚴格的測試。(校長)和threadstacksize選項解釋很類似,官方文檔似乎沒有解釋,在論壇中有這樣一句話:-Xss is translated in a VM flag named ThreadStackSize”一般設置這個值就可以了 |
-XX:NewRatio |
年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代) |
|
-XX:NewRatio=4表示年輕代與年老代所占比值為1:4,年輕代占整個堆棧的1/5Xms=Xmx并且設置了Xmn的情況下,該參數不需要進行設置。 |
-XX:SurvivorRatio |
Eden區與Survivor區的大小比值 |
|
設置為8,則兩個Survivor區與一個Eden區的比值為2:8,一個Survivor區占整個年輕代的1/10 |
-XX:+DisableExplicitGC |
關閉System.gc() |
|
這個參數需要嚴格的測試 |
-XX:PretenureSizeThreshold |
對象超過多大是直接在舊生代分配 |
0 |
單位字節 新生代采用Parallel ScavengeGC時無效另一種直接在舊生代分配的情況是大的數組對象,且數組中無外部引用對象. |
-XX:ParallelGCThreads |
并行收集器的線程數 |
|
此值最好配置與處理器數目相等 同樣適用于CMS |
-XX:MaxGCPauseMillis |
每次年輕代垃圾回收的最長時間(最大暫停時間) |
|
如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此值. |
其實還有一些打印及CMS方面的參數,這里就不以一一列舉了
四、關于JVM調優的一些方面
根據剛剛涉及的jvm的知識點,我們可以嘗試對JVM進行調優,主要就是堆內存那塊
所有線程共享數據區大小=新生代大小 + 年老代大小 + 持久代大小。持久代一般固定大小為64m。所以java堆中增大年輕代后,將會減小年老代大小(因為老年代的清理是使用fullgc,所以老年代過小的話反而是會增多fullgc的)。此值對系統性能影響較大,Sun官方推薦配置為java堆的3/8。
#4.1 調整最大堆內存和最小堆內存
-Xmx –Xms:指定java堆最大值(默認值是物理內存的1/4(<1GB))和初始java堆最小值(默認值是物理內存的1/64(<1GB))
默認(MinHeapFreeRatio參數可以調整)空余堆內存小于40%時,JVM就會增大堆直到-Xmx的最大限制.,默認(MaxHeapFreeRatio參數可以調整)空余堆內存大于70%時,JVM會減少堆直到 -Xms的最小限制。簡單點來說,你不停地往堆內存里面丟數據,等它剩余大小小于40%了,JVM就會動態申請內存空間不過會小于-Xmx,如果剩余大小大于70%,又會動態縮小不過不會小于–Xms。就這么簡單
開發過程中,通常會將 -Xms 與 -Xmx兩個參數配置成相同的值,其目的是為了能夠在java垃圾回收機制清理完堆區后不需要重新分隔計算堆區的大小而浪費資源。
我們執行下面的代碼
System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間
System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間
System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M"); //當前可用的總空間
注意:此處設置的是Java堆大小,也就是新生代大小 + 老年代大小
設置一個VM options的參數
-Xmx20m -Xms5m -XX:+PrintGCDetails
再次啟動main方法
這里GC彈出了一個Allocation Failure分配失敗,這個事情發生在PSYoungGen,也就是年輕代中
這時候申請到的內存為18M,空閑內存為4.214195251464844M
我們此時創建一個字節數組看看,執行下面的代碼
byte[] b = new byte[1 * 1024 * 1024];
System.out.println("分配了1M空間給數組");
System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間
System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間
System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M");
此時free memory就又縮水了,不過total memory是沒有變化的。Java會盡可能將total mem的值維持在最小堆內存大小
byte[] b = new byte[10 * 1024 * 1024];
System.out.println("分配了10M空間給數組");
System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間
System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間
System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M");
這時候我們創建了一個10M的字節數據,這時候最小堆內存是頂不住的。我們會發現現在的total memory已經變成了15M,這就是已經申請了一次內存的結果。
此時我們再跑一下這個代碼
System.gc();
System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間
System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間
System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M");
此時我們手動執行了一次fullgc,此時total memory的內存空間又變回5.5M了,此時又是把申請的內存釋放掉的結果。
#4.2 調整新生代和老年代的比值
-XX:NewRatio --- 新生代(eden+2*Survivor)和老年代(不包含永久區)的比值
例如:-XX:NewRatio=4,表示新生代:老年代=1:4,即新生代占整個堆的1/5。在Xms=Xmx并且設置了Xmn的情況下,該參數不需要進行設置。
#4.3 調整Survivor區和Eden區的比值
-XX:SurvivorRatio(幸存代)--- 設置兩個Survivor區和eden的比值
例如:8,表示兩個Survivor:eden=2:8,即一個Survivor占年輕代的1/10
#4.4 設置年輕代和老年代的大小
-XX:NewSize --- 設置年輕代大小
-XX:MaxNewSize --- 設置年輕代最大值
可以通過設置不同參數來測試不同的情況,反正最優解當然就是官方的Eden和Survivor的占比為8:1:1,然后在剛剛介紹這些參數的時候都已經附帶了一些說明,感興趣的也可以看看。反正最大堆內存和最小堆內存如果數值不同會導致多次的gc,需要注意。
#4.5 小總結
根據實際事情調整新生代和幸存代的大小,官方推薦新生代占java堆的3/8,幸存代占新生代的1/10
在OOM時,記得Dump出堆,確保可以排查現場問題,通過下面命令你可以輸出一個.dump文件,這個文件可以使用VisualVM或者Java自帶的Java VisualVM工具。
-Xmx20m -Xms5m -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=你要輸出的日志路徑
一般我們也可以通過編寫腳本的方式來讓OOM出現時給我們報個信,可以通過發送郵件或者重啟程序等來解決。
#4.6 永久區的設置
-XX:PermSize -XX:MaxPermSize
初始空間(默認為物理內存的1/64)和最大空間(默認為物理內存的1/4)。也就是說,jvm啟動時,永久區一開始就占用了PermSize大小的空間,如果空間還不夠,可以繼續擴展,但是不能超過MaxPermSize,否則會OOM。
tips:如果堆空間沒有用完也拋出了OOM,有可能是永久區導致的。堆空間實際占用非常少,但是永久區溢出 一樣拋出OOM。
#4.7 JVM的棧參數調優
#4.7.1 調整每個線程棧空間的大小
可以通過-Xss:調整每個線程棧空間的大小
JDK5.0以后每個線程堆棧大小為1M,以前每個線程堆棧大小為256K。在相同物理內存下,減小這個值能生成更多的線程。但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右
#4.7.2 設置線程棧的大小
-XXThreadStackSize:
設置線程棧的大小(0 means use default stack size)
這些參數都是可以通過自己編寫程序去簡單測試的,這里礙于篇幅問題就不再提供demo了
#4.8 (可以直接跳過了)JVM其他參數介紹
形形色色的參數很多,就不會說把所有都扯個遍了,因為大家其實也不會說一定要去深究到底。
#4.8.1 設置內存頁的大小
-XXThreadStackSize:
設置內存頁的大小,不可設置過大,會影響Perm的大小
#4.8.2 設置原始類型的快速優化
-XX:+UseFastAccessorMethods:
設置原始類型的快速優化
#4.8.3 設置關閉手動GC
-XX:+DisableExplicitGC:
設置關閉System.gc()(這個參數需要嚴格的測試)
#4.8.4 設置垃圾最大年齡
-XX:MaxTenuringThreshold
設置垃圾最大年齡。如果設置為0的話,則年輕代對象不經過Survivor區,直接進入年老代.
對于年老代比較多的應用,可以提高效率。如果將此值設置為一個較大值,
則年輕代對象會在Survivor區進行多次復制,這樣可以增加對象再年輕代的存活時間,
增加在年輕代即被回收的概率。該參數只有在串行GC時才有效.
#4.8.5 加快編譯速度
-XX:+AggressiveOpts
加快編譯速度
#4.8.6 改善鎖機制性能
-XX:+UseBiasedLocking
#4.8.7 禁用垃圾回收
-Xnoclassgc
#4.8.8 設置堆空間存活時間
-XX:SoftRefLRUPolicyMSPerMB
設置每兆堆空閑空間中SoftReference的存活時間,默認值是1s。
#4.8.9 設置對象直接分配在老年代
-XX:PretenureSizeThreshold
設置對象超過多大時直接在老年代分配,默認值是0。
#4.8.10 設置TLAB占eden區的比例
-XX:TLABWasteTargetPercent
設置TLAB占eden區的百分比,默認值是1% 。
#4.8.11設置是否優先YGC
-XX:+CollectGen0First
設置FullGC時是否先YGC,默認值是false。
#finally
真的扯了很久這東西,參考了多方的資料