小白搞懂了GC全過(guò)程,全靠阿里專家12張圖
最近有些讀者反應(yīng):看了很多網(wǎng)上關(guān)于JVM的文章,但是大部分文章不夠通俗易懂,看不太明白。希望筆者能寫幾篇關(guān)于JVM的文章,剛好我也有這方面的打算。從本文開(kāi)始推出JVM系列原創(chuàng)文章!
GC-垃圾回收,是Java程序員長(zhǎng)聊的話題,理解JVM垃圾回收的原理和過(guò)程,不但有助于寫出高質(zhì)量高性能的代碼,也可以幫你在面試官面前侃侃而談!
讀完本文,對(duì)垃圾回收過(guò)程、以及回收算法在垃圾回收中的應(yīng)用,將會(huì)有一個(gè)全新的認(rèn)識(shí)和理解。
堆內(nèi)存結(jié)構(gòu)
我們以Java官方的HotSpot JVM為例,在描述GC過(guò)程前,先了解一下堆內(nèi)存的結(jié)構(gòu)。
JVM將堆內(nèi)存分為了三部分:新生代(Young Generation),老年代(Old Generation),永久代(Permanent Generation)。其中新生代又分為三部分:伊甸園區(qū)(Eden),和兩個(gè)幸存區(qū)S0和S1。
注:JDK1.8之后,Java官方的HotSpot JVM去掉了永久代,取而代之的是元數(shù)據(jù)區(qū)Metaspace。Metaspace使用的是本地內(nèi)存,而不是堆內(nèi)存,也就是說(shuō)在默認(rèn)情況下Metaspace的大小只與本地內(nèi)存的大小有關(guān)。因此JDK1.8之后,就見(jiàn)不到j(luò)ava.lang.OutOfMemoryError: PermGen space這種由于永久代空間不足導(dǎo)致的內(nèi)存溢出的問(wèn)題了。
垃圾回收全過(guò)程
新創(chuàng)建的對(duì)象會(huì)先被分配到到Eden區(qū)。JVM剛啟動(dòng)時(shí),Eden區(qū)對(duì)象數(shù)量較少,兩個(gè)Survivor區(qū)S0、S1幾乎是空的。
隨著時(shí)間的推移,Eden區(qū)的對(duì)象越來(lái)越多。當(dāng)Eden區(qū)放不下時(shí)(占用空間達(dá)到容量閾值),新生代就會(huì)發(fā)生垃圾回收,我們稱之為Minor GC或者Young GC。
發(fā)生GC時(shí),第一步會(huì)通過(guò)可達(dá)性分析算法找到可達(dá)對(duì)象。如上圖,藍(lán)色為可達(dá)對(duì)象,其他紫色為不可達(dá)對(duì)象。第二步,被標(biāo)示的可達(dá)對(duì)象會(huì)被轉(zhuǎn)移到S0(此時(shí)S0是From Survivor),此時(shí)存活對(duì)象年齡加1,三個(gè)對(duì)象年齡都變?yōu)?。第三步,清除Eden區(qū)所有對(duì)象。
GC后各區(qū)域?qū)ο笳加们闆r,如上圖所示。
程序繼續(xù)運(yùn)行,Eden區(qū)再次達(dá)到容量閾值時(shí),會(huì)再次發(fā)生GC。這時(shí)S0(From Survivor)已經(jīng)有了對(duì)象。還是同樣的步驟,通過(guò)可達(dá)性分析算法找到可達(dá)對(duì)象,然后再將Eden和S0中的可達(dá)對(duì)象轉(zhuǎn)移到S1(To Survivor),各存活對(duì)象年齡加1。最后將Eden和S0中的所有對(duì)象清除。
GC后S0區(qū)域被清空。如上圖所示。S0和S1發(fā)生了互換,S1變成了From Survivor,S0變成了To Survivor。
注意,To Survivor區(qū)永遠(yuǎn)都為空。這實(shí)際上是垃圾回收算法-復(fù)制算法在年輕代的實(shí)際應(yīng)用。把年輕代分為Eden,S0,S1三個(gè)區(qū)域,每次垃圾回收時(shí)把可達(dá)對(duì)象復(fù)制到S0或S1,然后再清除掉Eden和(S1或S0)中的所有對(duì)象。由于每次GC時(shí),新生代的可達(dá)對(duì)象非常少(絕大部分對(duì)象要被回收掉),一般不會(huì)超過(guò)新生代總體空間的10%,所以搜尋可達(dá)對(duì)象以及復(fù)制對(duì)象的成本都會(huì)非常低。而且這種復(fù)制的方式還能避免產(chǎn)生堆內(nèi)存碎片,提高內(nèi)存利用率。很多年輕代垃圾收集器都采用復(fù)制算法,如ParNew。
在程序運(yùn)行過(guò)程中,新生代GC會(huì)反復(fù)發(fā)生,長(zhǎng)壽對(duì)象會(huì)在S0和S1之間反復(fù)交換,年齡也會(huì)越來(lái)越大,當(dāng)對(duì)象達(dá)到年齡上限時(shí),會(huì)被晉升到老年代。這個(gè)年齡上限默認(rèn)是15,可以通過(guò)參數(shù)-XX:MaxTenuringThreshold設(shè)置。如下圖,有些年輕代對(duì)象年齡達(dá)到了上限15,被轉(zhuǎn)移到了老年代。
其他晉升方式。新生代對(duì)象晉升到老年代,除了根據(jù)年齡正常晉升外。為了提高JVM的性能,JVM設(shè)計(jì)者還考慮了其他晉升方式。
大對(duì)象直接晉升。大對(duì)象會(huì)跨過(guò)年輕代直接分配到老年代??梢酝ㄟ^(guò)-XX:PretenureSizeThreshold參數(shù)設(shè)置對(duì)象大小。如果參數(shù)被設(shè)置成5MB,超過(guò)5MB的大對(duì)象會(huì)直接分配到老年代。這樣做的目的,是為了避免大對(duì)象在Eden區(qū)及兩個(gè)Survivor區(qū)之間大量的內(nèi)存復(fù)制,大對(duì)象的內(nèi)存復(fù)制耗時(shí)比普通對(duì)象要高很多。
注意:PretenureSizeThreshold參數(shù)只對(duì)Serial和ParNew兩種回收器有效。
動(dòng)態(tài)對(duì)象年齡判定。如果在Survivor空間中相同年齡對(duì)象大小的總和大于Survivor空間的一半,年齡大于或等于該年齡的對(duì)象會(huì)直接進(jìn)入老年代,而不用等到MaxTenuringThreshold中設(shè)置的年齡上限。上圖,年齡為1的對(duì)象超過(guò)了Survivor空間的一半,所以這幾個(gè)對(duì)象會(huì)直接進(jìn)入老年代。
實(shí)際上,上面對(duì)動(dòng)態(tài)對(duì)象年齡判定的描述并不精確。上圖的場(chǎng)景也會(huì)導(dǎo)致相關(guān)對(duì)象晉升到老年代。年齡為1的對(duì)象加上年齡為2的對(duì)象超過(guò)了半數(shù),這時(shí)包括年齡為2的對(duì)象以及年齡更大的對(duì)象都會(huì)被晉升到老年代。所以上圖中年齡為2和3的對(duì)象都會(huì)被晉升到老年代。
老年代垃圾回收。隨著年輕代對(duì)象的不斷晉升,老年代的對(duì)象變得越來(lái)越多,達(dá)到容量閾值后老年代也會(huì)發(fā)生垃圾回收,我們稱之為Major GC或者Full GC,F(xiàn)ull GC并不是全局GC,它只發(fā)生在老年代。
雖然年輕代和老年代都會(huì)發(fā)生GC,但是每次GC的時(shí)間和成本卻大不相同。由于老年代空間大小一般是年輕代的幾倍,再加上老年代對(duì)象存活率很高,所以整個(gè)標(biāo)記過(guò)程比較慢,GC成本也非常高。我們經(jīng)常說(shuō)的JVM調(diào)優(yōu),主要是為了盡量減少老年代Full GC的時(shí)間和頻次。
老年代垃圾回收器,很少使用復(fù)制算法,主要為了避免大量對(duì)象的內(nèi)存復(fù)制帶來(lái)的時(shí)間和空間上的開(kāi)銷,一般采用標(biāo)記清除、標(biāo)記整理算法,就地標(biāo)記回收。例如,老年代垃圾收集器CMS就采用了標(biāo)記清除算法。對(duì)于標(biāo)記清除算法帶來(lái)的內(nèi)存碎片問(wèn)題,CMS提供了兩個(gè)參數(shù)做碎片整理,-XX:+UseCMSCompactAtFullCollection和-XX:CMSFullGCsBeforeCompaction。
希望本文對(duì)大家有所幫助。
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!