最近有些讀者反應:看了很多網(wǎng)上關于JVM的文章,但是大部分文章不夠通俗易懂,看不太明白。希望筆者能寫幾篇關于JVM的文章,剛好我也有這方面的打算。從本文開始推出JVM系列原創(chuàng)文章!
GC-垃圾回收,是Java程序員長聊的話題,理解JVM垃圾回收的原理和過程,不但有助于寫出高質(zhì)量高性能的代碼,也可以幫你在面試官面前侃侃而談!
讀完本文,對垃圾回收過程、以及回收算法在垃圾回收中的應用,將會有一個全新的認識和理解。

堆內(nèi)存結(jié)構(gòu)
我們以Java官方的HotSpot JVM為例,在描述GC過程前,先了解一下堆內(nèi)存的結(jié)構(gòu)。
JVM將堆內(nèi)存分為了三部分:新生代(Young Generation),老年代(Old Generation),永久代(Permanent Generation)。其中新生代又分為三部分:伊甸園區(qū)(Eden),和兩個幸存區(qū)S0和S1。
注:JDK1.8之后,Java官方的HotSpot JVM去掉了永久代,取而代之的是元數(shù)據(jù)區(qū)Metaspace。Metaspace使用的是本地內(nèi)存,而不是堆內(nèi)存,也就是說在默認情況下Metaspace的大小只與本地內(nèi)存的大小有關。因此JDK1.8之后,就見不到java.lang.OutOfMemoryError: PermGen space這種由于永久代空間不足導致的內(nèi)存溢出的問題了。
垃圾回收全過程
新創(chuàng)建的對象會先被分配到到Eden區(qū)。JVM剛啟動時,Eden區(qū)對象數(shù)量較少,兩個Survivor區(qū)S0、S1幾乎是空的。
隨著時間的推移,Eden區(qū)的對象越來越多。當Eden區(qū)放不下時(占用空間達到容量閾值),新生代就會發(fā)生垃圾回收,我們稱之為Minor GC或者Young GC。
發(fā)生GC時,第一步會通過可達性分析算法找到可達對象。如上圖,藍色為可達對象,其他紫色為不可達對象。第二步,被標示的可達對象會被轉(zhuǎn)移到S0(此時S0是From Survivor),此時存活對象年齡加1,三個對象年齡都變?yōu)?。第三步,清除Eden區(qū)所有對象。
GC后各區(qū)域?qū)ο笳加们闆r,如上圖所示。
程序繼續(xù)運行,Eden區(qū)再次達到容量閾值時,會再次發(fā)生GC。這時S0(From Survivor)已經(jīng)有了對象。還是同樣的步驟,通過可達性分析算法找到可達對象,然后再將Eden和S0中的可達對象轉(zhuǎn)移到S1(To Survivor),各存活對象年齡加1。最后將Eden和S0中的所有對象清除。
GC后S0區(qū)域被清空。如上圖所示。S0和S1發(fā)生了互換,S1變成了From Survivor,S0變成了To Survivor。
注意,To Survivor區(qū)永遠都為空。這實際上是垃圾回收算法-復制算法在年輕代的實際應用。把年輕代分為Eden,S0,S1三個區(qū)域,每次垃圾回收時把可達對象復制到S0或S1,然后再清除掉Eden和(S1或S0)中的所有對象。由于每次GC時,新生代的可達對象非常少(絕大部分對象要被回收掉),一般不會超過新生代總體空間的10%,所以搜尋可達對象以及復制對象的成本都會非常低。而且這種復制的方式還能避免產(chǎn)生堆內(nèi)存碎片,提高內(nèi)存利用率。很多年輕代垃圾收集器都采用復制算法,如ParNew。
在程序運行過程中,新生代GC會反復發(fā)生,長壽對象會在S0和S1之間反復交換,年齡也會越來越大,當對象達到年齡上限時,會被晉升到老年代。這個年齡上限默認是15,可以通過參數(shù)-XX:MaxTenuringThreshold設置。如下圖,有些年輕代對象年齡達到了上限15,被轉(zhuǎn)移到了老年代。
其他晉升方式。新生代對象晉升到老年代,除了根據(jù)年齡正常晉升外。為了提高JVM的性能,JVM設計者還考慮了其他晉升方式。
大對象直接晉升。大對象會跨過年輕代直接分配到老年代??梢酝ㄟ^-XX:PretenureSizeThreshold參數(shù)設置對象大小。如果參數(shù)被設置成5MB,超過5MB的大對象會直接分配到老年代。這樣做的目的,是為了避免大對象在Eden區(qū)及兩個Survivor區(qū)之間大量的內(nèi)存復制,大對象的內(nèi)存復制耗時比普通對象要高很多。
注意:PretenureSizeThreshold參數(shù)只對Serial和ParNew兩種回收器有效。
動態(tài)對象年齡判定。如果在Survivor空間中相同年齡對象大小的總和大于Survivor空間的一半,年齡大于或等于該年齡的對象會直接進入老年代,而不用等到MaxTenuringThreshold中設置的年齡上限。上圖,年齡為1的對象超過了Survivor空間的一半,所以這幾個對象會直接進入老年代。
實際上,上面對動態(tài)對象年齡判定的描述并不精確。上圖的場景也會導致相關對象晉升到老年代。年齡為1的對象加上年齡為2的對象超過了半數(shù),這時包括年齡為2的對象以及年齡更大的對象都會被晉升到老年代。所以上圖中年齡為2和3的對象都會被晉升到老年代。
老年代垃圾回收。隨著年輕代對象的不斷晉升,老年代的對象變得越來越多,達到容量閾值后老年代也會發(fā)生垃圾回收,我們稱之為Major GC或者Full GC,F(xiàn)ull GC并不是全局GC,它只發(fā)生在老年代。
雖然年輕代和老年代都會發(fā)生GC,但是每次GC的時間和成本卻大不相同。由于老年代空間大小一般是年輕代的幾倍,再加上老年代對象存活率很高,所以整個標記過程比較慢,GC成本也非常高。我們經(jīng)常說的JVM調(diào)優(yōu),主要是為了盡量減少老年代Full GC的時間和頻次。
老年代垃圾回收器,很少使用復制算法,主要為了避免大量對象的內(nèi)存復制帶來的時間和空間上的開銷,一般采用標記清除、標記整理算法,就地標記回收。例如,老年代垃圾收集器CMS就采用了標記清除算法。對于標記清除算法帶來的內(nèi)存碎片問題,CMS提供了兩個參數(shù)做碎片整理,-XX:+UseCMSCompactAtFullCollection和-XX:CMSFullGCsBeforeCompaction。
希望本文對大家有所幫助。
免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!