溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何理解JVM ZGC垃圾收集器

發(fā)布時間:2021-10-23 16:26:42 來源:億速云 閱讀:119 作者:柒染 欄目:云計(jì)算

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何理解JVM  ZGC垃圾收集器,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

如果下面的一些概念有些不清楚的可以先看深入理解JVM - 垃圾收集器和深入理解JVM - Shenandoah垃圾收集器。

ZGC(Z Garbage Collector)是一款由Oracle公司研發(fā)的,以低延遲為首要目標(biāo)的一款垃圾收集器。它是基于動態(tài)Region內(nèi)存布局,(暫時)不設(shè)年齡分代,使用了讀屏障、染色指針和內(nèi)存多重映射等技術(shù)來實(shí)現(xiàn)可并發(fā)的標(biāo)記-整理算法的收集器。在JDK 11新加入,還在實(shí)驗(yàn)階段,主要特點(diǎn)是:回收TB級內(nèi)存(最大4T),停頓時間不超過10ms。

動態(tài)Region

ZGC的Region可以具有如圖所示的大、中、小三類容量:

如何理解JVM  ZGC垃圾收集器

  • 小型Region(Small Region):容量固定為2MB,用于放置小于256KB的小對象。

  • 中型Region(Medium Region):容量固定為32MB,用于放置大于等于256KB但小于4MB的對象?!?/p>

  • 大型Region(Large Region):容量不固定,可以動態(tài)變化,但必須為2MB的整數(shù)倍,用于放置4MB或以上的大對象。每個大型Region中只會存放一個大對象,最小容量可低至4MB,所有大型Region可能小于中型Region。大型Region在ZGC的實(shí)現(xiàn)中是不會被重分配的,因?yàn)閺?fù)制一個大對象的代價非常高昂。

染色指針技術(shù)

HotSpot虛擬機(jī)的標(biāo)記實(shí)現(xiàn)方案有如下幾種:

(1)把標(biāo)記直接記錄在對象頭上(如Serial收集器);

(2)把標(biāo)記記錄在與對象相互獨(dú)立的數(shù)據(jù)結(jié)構(gòu)上(如G1、Shenandoah使用了一種相當(dāng)于堆內(nèi)存的1/64大小的,稱為BitMap的結(jié)構(gòu)來記錄標(biāo)記信息);

(3)直接把標(biāo)記信息記在引用對象的指針上(如ZGC)

染色指針是一種直接將少量額外的信息存儲在指針上的技術(shù)。目前在Linux下64位的操作系統(tǒng)中高18位是不能用來尋址的,但是剩余的46為卻可以支持64T的空間,到目前為止我們幾乎還用不到這么多內(nèi)存。于是ZGC將46位中的高4位取出,用來存儲4個標(biāo)志位,剩余的42位可以支持4T的內(nèi)存,如圖所示:

如何理解JVM  ZGC垃圾收集器

  • Linux下64位指針的高18位不能用來尋址,所有不能使用;

  • Finalizable:表示是否只能通過finalize()方法才能被訪問到,其他途徑不行;

  • Remapped:表示是否進(jìn)入了重分配集(即被移動過);

  • Marked1、Marked0:表示對象的三色標(biāo)記狀態(tài);

  • 最后42用來存對象地址,最大支持4T;

三色標(biāo)記

在并發(fā)的可達(dá)性分析算法中我們使用三色標(biāo)記(Tri-color Marking)來標(biāo)記對象是否被收集器訪問過:

  • 白色:表示對象尚未被垃圾收集器訪問過。顯然在可達(dá)性分析剛剛開始的階段,所有的對象都是白色的,若在分析結(jié)束的階段,仍然是白色的對象,即代表不可達(dá)。

  • 黑色:表示對象已經(jīng)被垃圾收集器訪問過,且這個對象的所有引用都已經(jīng)掃描過。黑色的對象代表已經(jīng)掃描過,它是安全存活的,如果有其他對象引用指向了黑色對象,無須重新掃描一遍。黑色對象不可能直接(不經(jīng)過灰色對象)指向某個白色對象。

  • 灰色:表示對象已經(jīng)被垃圾收集器訪問過,但這個對象上至少存在一個引用還沒有被掃描過。

可達(dá)性分析的掃描過程,其實(shí)就是一股以灰色為波峰的波紋從黑向白推進(jìn)的過程,但是在并發(fā)的推進(jìn)過程中會產(chǎn)生“對象消失”的問題,如圖:、

如何理解JVM  ZGC垃圾收集器

對象消失理論,只有同時滿足才會發(fā)生對象消失:

  • 賦值器插入了一條或多條從黑色對象到白色對象的新引用;

  • 賦值器刪除了全部從灰色對象到該白色對象的直接或間接引用;

要解決對象消失問題只需要破壞其中一條就行了,目前常用有兩種方案:

  • 增量更新(Incremental Update):增量更新要破壞的是第一個條件,當(dāng)黑色對象插入新的指向白色對象的引用關(guān)系時,就將這個新插入的引用記錄下來,等并發(fā)掃描結(jié)束之后,再將這些記錄過的引用關(guān)系中的黑色對象為根,重新掃描一次。這可以簡化理解為,黑色對象一旦新插入了指向白色對象的引用之后,它就變回灰色對象了。

  • 原始快照(Snapshot At TheBeginning,SATB):原始快照要破壞的是第二個條件,當(dāng)灰色對象要刪除指向白色對象的引用關(guān)系時,就將這個要刪除的引用記錄下來,在并發(fā)掃描結(jié)束之后,再將這些記錄過的引用關(guān)系中的灰色對象為根,重新掃描一次。這也可以簡化理解為,無論引用關(guān)系刪除與否,都會按照剛剛開始掃描那一刻的對象圖快照來進(jìn)行搜索。

以上無論是對引用關(guān)系記錄的插入還是刪除,虛擬機(jī)的記錄操作都是通過寫屏障實(shí)現(xiàn)的。CMS是基于增量更新來做并發(fā)標(biāo)記的,G1、Shenandoah則是用原始快照來實(shí)現(xiàn)。

染色指針的三大優(yōu)勢

(1)一旦某個Region的存活對象被移走之后,這個Region立即就能夠被釋放和重用掉,而不必等待整個堆中所有指向該Region的引用都被修正后才能清理,這使得理論上只要還有一個空閑Region,ZGC就能完成收集。而Shenandoah需要等到更新階段結(jié)束才能釋放回收集中的Region,如果Region里面對象都存活的時候,需要1:1的空間才能完成收集。

(2)染色指針可以大幅減少在垃圾收集過程中內(nèi)存屏障的使用數(shù)量,ZGC只使用了讀屏障。

(3)染色指針具備強(qiáng)大的擴(kuò)展性,它可以作為一種可擴(kuò)展的存儲結(jié)構(gòu)用來記錄更多與對象標(biāo)記、重定位過程相關(guān)的數(shù)據(jù),以便日后進(jìn)一步提高性能。

內(nèi)存多重映射

ZGC使用了內(nèi)存多重映射(Multi-Mapping)將多個不同的虛擬內(nèi)存地址映射到同一個物理內(nèi)存地址上,這是一種多對一映射,意味著ZGC在虛擬內(nèi)存中看到的地址空間要比實(shí)際的堆內(nèi)存容量來得更大。把染色指針中的標(biāo)志位看作是地址的分段符,那只要將這些不同的地址段都映射到同一個物理內(nèi)存空間,經(jīng)過多重映射轉(zhuǎn)換后,就可以使用染色指針正常進(jìn)行尋址了,效果如圖:

如何理解JVM  ZGC垃圾收集器

ZGC的多重映射只是它采用染色指針技術(shù)的伴生產(chǎn)物

讀屏障

當(dāng)對象從堆中加載的時候,就會使用到讀屏障(Load Barrier)。這里使用讀屏障的主要作用就是檢查指針上的三色標(biāo)記位,根據(jù)標(biāo)記位判斷出對象是否被移動過,如果沒有可以直接訪問,如果移動過就需要進(jìn)行“自愈”(對象訪問會變慢,但也只會有一次變慢),當(dāng)“自愈”完成后,后續(xù)訪問就不會變慢了。

讀寫屏障可以理解成對象訪問的“AOP”操作

ZGC運(yùn)作過程

ZGC的運(yùn)作過程大致可劃分為以下四個大的階段:

如何理解JVM  ZGC垃圾收集器

  • 并發(fā)標(biāo)記(Concurrent Mark):與G1、Shenandoah一樣,并發(fā)標(biāo)記是遍歷對象圖做可達(dá)性分析的階段,它的初始標(biāo)記和最終標(biāo)記也會出現(xiàn)短暫的停頓,整個標(biāo)記階段只會更新染色指針中的Marked 0、Marked 1標(biāo)志位。

  • 并發(fā)預(yù)備重分配(Concurrent Prepare for Relocate):這個階段需要根據(jù)特定的查詢條件統(tǒng)計(jì)得出本次收集過程要清理哪些Region,將這些Region組成重分配集(Relocation Set)。ZGC每次回收都會掃描所有的Region,用范圍更大的掃描成本換取省去G1中記憶集的維護(hù)成本。

  • 并發(fā)重分配(Concurrent Relocate):重分配是ZGC執(zhí)行過程中的核心階段,這個過程要把重分配集中的存活對象復(fù)制到新的Region上,并為重分配集中的每個Region維護(hù)一個轉(zhuǎn)發(fā)表(Forward Table),記錄從舊對象到新對象的轉(zhuǎn)向關(guān)系。ZGC收集器能僅從引用上就明確得知一個對象是否處于重分配集之中,如果用戶線程此時并發(fā)訪問了位于重分配集中的對象,這次訪問將會被預(yù)置的內(nèi)存屏障所截獲,然后立即根據(jù)Region上的轉(zhuǎn)發(fā)表記錄將訪問轉(zhuǎn)發(fā)到新復(fù)制的對象上,并同時修正更新該引用的值,使其直接指向新對象,ZGC將這種行為稱為指針的“自愈”(Self-Healing)能力。

ZGC的染色指針因?yàn)椤白杂保⊿elf-Healing)能力,所以只有第一次訪問舊對象會變慢,而Shenandoah的Brooks轉(zhuǎn)發(fā)指針是每次都會變慢。

一旦重分配集中某個Region的存活對象都復(fù)制完畢后,這個Region就可以立即釋放用于新對象的分配,但是轉(zhuǎn)發(fā)表還得留著不能釋放掉,因?yàn)榭赡苓€有訪問在使用這個轉(zhuǎn)發(fā)表。

  • 并發(fā)重映射(Concurrent Remap):重映射所做的就是修正整個堆中指向重分配集中舊對象的所有引用,但是ZGC中對象引用存在“自愈”功能,所以這個重映射操作并不是很迫切。ZGC很巧妙地把并發(fā)重映射階段要做的工作,合并到了下一次垃圾收集循環(huán)中的并發(fā)標(biāo)記階段里去完成,反正它們都是要遍歷所有對象的,這樣合并就節(jié)省了一次遍歷對象圖的開銷。

ZGC存在的問題

ZGC最大的問題是浮動垃圾。

浮動垃圾

ZGC的停頓時間是在10ms以下,但是ZGC的執(zhí)行時間還是遠(yuǎn)遠(yuǎn)大于這個時間的。假如ZGC全過程需要執(zhí)行10分鐘,在這個期間由于對象分配速率很高,將創(chuàng)建大量的新對象,這些對象很難進(jìn)入當(dāng)次GC,所以只能在下次GC的時候進(jìn)行回收,這些只能等到下次GC才能回收的對象就是浮動垃圾。

ZGC沒有分代概念,每次都需要進(jìn)行全堆掃描,導(dǎo)致一些“朝生夕死”的對象沒能及時的被回收。

解決方案

目前唯一的辦法是增大堆的容量,使得程序得到更多的喘息時間,但是這個也是一個治標(biāo)不治本的方案。如果需要從根本上解決這個問題,還是需要引入分代收集,讓新生對象都在一個專門的區(qū)域中創(chuàng)建,然后專門針對這個區(qū)域進(jìn)行更頻繁、更快的收集。

官方測試數(shù)據(jù)

停頓時間

在ZGC的停頓時間測試上,和其他收集器相比完全不在一個數(shù)量級,如圖:

如何理解JVM  ZGC垃圾收集器

吞吐量

ZGC的“弱項(xiàng)”吞吐量方面,以低延遲為首要目標(biāo)的ZGC已經(jīng)達(dá)到了以高吞吐量為目標(biāo)Parallel Scavenge的99%,直接超越了G1,如圖:

如何理解JVM  ZGC垃圾收集器

優(yōu)缺點(diǎn)

優(yōu)點(diǎn):低停頓,高吞吐量,ZGC收集過程中額外耗費(fèi)的內(nèi)存小

缺點(diǎn):浮動垃圾

上述就是小編為大家分享的如何理解JVM  ZGC垃圾收集器了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI