溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python語法垃圾回收機(jī)制原理解析

發(fā)布時(shí)間:2020-09-07 01:34:09 來源:腳本之家 閱讀:148 作者:jueyuanfengsheng 欄目:開發(fā)技術(shù)

一 引入

解釋器在執(zhí)行到定義變量的語法時(shí),會(huì)申請內(nèi)存空間來存放變量的值,而內(nèi)存的容量是有限的,這就涉及到變量值所占用內(nèi)存空間的回收問題,當(dāng)一個(gè)變量值沒有用了(簡稱垃圾)就應(yīng)該將其占用的內(nèi)存給回收掉,那什么樣的變量值是沒有用的呢?
由于變量名是訪問到變量值的唯一方式,所以當(dāng)一個(gè)變量值不再關(guān)聯(lián)任何變量名時(shí),我們就無法再訪問到該變量值了,該變量值就是沒有用的,就應(yīng)該被當(dāng)成一個(gè)垃圾回收。

毫無疑問,內(nèi)存空間的申請與回收是非常耗費(fèi)精力的事情,而且存在很大的危險(xiǎn)性,稍有不慎就有可能引發(fā)內(nèi)存溢出問題,好在Cpython解釋器提供了自動(dòng)的垃圾回收機(jī)制來幫我們 解決了這件事。

二、什么是垃圾回收機(jī)制?

垃圾回收機(jī)制(簡稱GC)是Python解釋器自帶一種機(jī),專門用來回收不可用的變量值所占用的內(nèi)存空間

三、為什么要用垃圾回收機(jī)制?

程序運(yùn)行過程中會(huì)申請大量的內(nèi)存空間,而對于一些無用的內(nèi)存空間如果不及時(shí)清理的話會(huì)導(dǎo)致內(nèi)存使用殆盡(內(nèi)存溢出),導(dǎo)致程序崩潰,因此管理內(nèi)存是一件重要且繁雜的事情,而python解釋器自帶的垃圾回收機(jī)制把程序員從繁雜的內(nèi)存管理中解放出來。

四、垃圾回收機(jī)制原理分析

Python的GC模塊主要運(yùn)用了“引用計(jì)數(shù)”(reference counting)來跟蹤和回收垃圾。在引用計(jì)數(shù)的基礎(chǔ)上,還可以通過“標(biāo)記-清除”(mark and sweep)解決容對象可能產(chǎn)生的循環(huán)引用的問題,并且通過“分代回收”(generation collection)以空間換取時(shí)間的方式來進(jìn)一步提高垃圾回收的效率。

4.1、什么是引用計(jì)數(shù)?

引用計(jì)數(shù)就是:變量值被變量名關(guān)聯(lián)的次數(shù)

如:age=18

變量值18被關(guān)聯(lián)了一個(gè)變量名age,稱之為引用計(jì)數(shù)為1

Python語法垃圾回收機(jī)制原理解析

引用計(jì)數(shù)增加:

age=18 (此時(shí),變量值18的引用計(jì)數(shù)為1)
m=age (把a(bǔ)ge的內(nèi)存地址給了m,此時(shí),m,age都關(guān)聯(lián)了18,所以變量值18的引用計(jì)數(shù)為2)

Python語法垃圾回收機(jī)制原理解析

引用計(jì)數(shù)減少:

age=10(名字age先與值18解除關(guān)聯(lián),再與3建立了關(guān)聯(lián),變量值18的引用計(jì)數(shù)為1)
del m(del的意思是解除變量名x與變量值18的關(guān)聯(lián)關(guān)系,此時(shí),變量18的引用計(jì)數(shù)為0)

Python語法垃圾回收機(jī)制原理解析

值18的引用計(jì)數(shù)一旦變?yōu)?,其占用的內(nèi)存地址就應(yīng)該被解釋器的垃圾回收機(jī)制回收

4.2、引用計(jì)數(shù)擴(kuò)展閱讀

變量值被關(guān)聯(lián)次數(shù)的增加或減少,都會(huì)引發(fā)引用計(jì)數(shù)機(jī)制的執(zhí)行(增加或減少值的引用計(jì)數(shù)),這存在明顯的效率問題。

如果說執(zhí)行效率還僅僅是引用計(jì)數(shù)機(jī)制的一個(gè)軟肋的話,那么很不幸,引用計(jì)數(shù)機(jī)制還存在著一個(gè)致命的弱點(diǎn),即循環(huán)引用(也稱交叉引用)

# 如下我們定義了兩個(gè)列表,簡稱列表1與列表2,變量名l1指向列表1,變量名l2指向列表2
>>> l1=['xxx'] # 列表1被引用一次,列表1的引用計(jì)數(shù)變?yōu)?
>>> l2=['yyy'] # 列表2被引用一次,列表2的引用計(jì)數(shù)變?yōu)?
>>> l1.append(l2) # 把列表2追加到l1中作為第二個(gè)元素,列表2的引用計(jì)數(shù)變?yōu)?
>>> l2.append(l1) # 把列表1追加到l2中作為第二個(gè)元素,列表1的引用計(jì)數(shù)變?yōu)?
# l1與l2之間有相互引用
# l1 = ['xxx'的內(nèi)存地址,列表2的內(nèi)存地址]
# l2 = ['yyy'的內(nèi)存地址,列表1的內(nèi)存地址]
>>> l1
['xxx', ['yyy', [...]]]
>>> l2
['yyy', ['xxx', [...]]]
>>> l1[1][1][

循環(huán)引用會(huì)導(dǎo)致:值不再被任何名字關(guān)聯(lián),但是值的引用計(jì)數(shù)并不會(huì)為0,應(yīng)該被回收但不能被回收,什么意思呢?試想一下,請看如下操作

>>> del l1 # 列表1的引用計(jì)數(shù)減1,列表1的引用計(jì)數(shù)變?yōu)?
>>> del l2 # 列表2的引用計(jì)數(shù)減1,列表2的引用計(jì)數(shù)變?yōu)?

此時(shí),只剩下列表1與列表2之間的相互引用,兩個(gè)列表的引用計(jì)數(shù)均不為0,但兩個(gè)列表不再被任何其他對象關(guān)聯(lián),沒有任何人可以再引用到它們,所以它倆占用內(nèi)存空間應(yīng)該被回收,但由于相互引用的存在,每一個(gè)對象的引用計(jì)數(shù)都不為0,因此這些對象所占用的內(nèi)存永遠(yuǎn)不會(huì)被釋放,所以循環(huán)引用是致命的,這與手動(dòng)進(jìn)行內(nèi)存管理所產(chǎn)生的內(nèi)存泄露毫無區(qū)別。所以Python引入了“標(biāo)記-清除” 與“分代回收”來分別解決引用計(jì)數(shù)的循環(huán)引用與效率低的問題

4.2.1 標(biāo)記-清除

容器對象(比如:list,set,dict,class,instance)都可以包含對其他對象的引用,所以都可能產(chǎn)生循環(huán)引用。而“標(biāo)記-清除”計(jì)數(shù)就是為了解決循環(huán)引用的問題。

在了解標(biāo)記清除算法前,我們需要明確一點(diǎn),關(guān)于變量的存儲(chǔ),內(nèi)存中有兩塊區(qū)域:堆區(qū)與棧區(qū),在定義變量時(shí),變量名與值內(nèi)存地址的關(guān)聯(lián)關(guān)系存放于棧區(qū),變量值存放于堆區(qū),內(nèi)存管理回收的則是堆區(qū)的內(nèi)容,詳解如下圖,定義了兩個(gè)變量x = 10、y = 20

Python語法垃圾回收機(jī)制原理解析

當(dāng)我們執(zhí)行x=y時(shí),內(nèi)存中的棧區(qū)與堆區(qū)變化如下

Python語法垃圾回收機(jī)制原理解析

標(biāo)記/清除算法的做法是當(dāng)應(yīng)用程序可用的內(nèi)存空間被耗盡的時(shí),就會(huì)停止整個(gè)程序,然后進(jìn)行兩項(xiàng)工作,第一項(xiàng)則是標(biāo)記,第二項(xiàng)則是清除

#1、標(biāo)記
標(biāo)記的過程其實(shí)就是,遍歷所有的GC Roots對象(棧區(qū)中的所有內(nèi)容或者線程都可以作為GC Roots對象),然后將所
有GC Roots的對象可以直接或間接訪問到的對象標(biāo)記為存活的對象,其余的均為非存活對象,應(yīng)該被清除。
#2、清除
清除的過程將遍歷堆中所有的對象,將沒有標(biāo)記的對象全部清除掉。

直接引用指的是從棧區(qū)出發(fā)直接引用到的內(nèi)存地址,間接引用指的是從棧區(qū)出發(fā)引用到堆區(qū)后再進(jìn)一步引用到的內(nèi)存地址,以我們之前的兩個(gè)列表l1與l2為例畫出如下圖像

Python語法垃圾回收機(jī)制原理解析

當(dāng)我們同時(shí)刪除l1與l2時(shí),會(huì)清理到棧區(qū)中l(wèi)1與l2的內(nèi)容

Python語法垃圾回收機(jī)制原理解析

這樣在啟用標(biāo)記清除算法時(shí),發(fā)現(xiàn)棧區(qū)內(nèi)不再有l(wèi)1與l2(只剩下堆區(qū)內(nèi)二者的相互引用),于是列表1與列表2都沒有被標(biāo)記為存活,二者會(huì)被清理掉,這樣就解決了循環(huán)引用帶來的內(nèi)存泄漏問題

4.2.2 分代回收

背景:

基于引用計(jì)數(shù)的回收機(jī)制,每次回收內(nèi)存,都需要把所有對象的引用計(jì)數(shù)都遍歷一遍,這是非常消耗時(shí)間的,于是引入了分代回收來提高回收效率,分代回收采用的是用“空間換時(shí)間”的策略。

分代:

分代回收的核心思想是:在歷經(jīng)多次掃描的情況下,都沒有被回收的變量,gc機(jī)制就會(huì)認(rèn)為,該變量是常用變量,gc對其掃描的頻率會(huì)降低,具體實(shí)現(xiàn)原理如下:

分代指的是根據(jù)存活時(shí)間來為變量劃分不同等級(也就是不同的代)
新定義的變量,放到新生代這個(gè)等級中,假設(shè)每隔1分鐘掃描新生代一次,如果發(fā)現(xiàn)變量依然被引用,那么該對象的權(quán)重(權(quán)重本質(zhì)就是個(gè)整數(shù))加一,當(dāng)變量的權(quán)重大于某個(gè)設(shè)定得值(假設(shè)為3),會(huì)將它移動(dòng)到更高一級的青春代,青春代的gc掃描的頻率低于新生代(掃描時(shí)間間隔更長),假設(shè)5分鐘掃描青春代一次,這樣每次gc需要掃描的變量的總個(gè)數(shù)就變少了,節(jié)省了掃描的總時(shí)間,接下來,青春代中的對象,也會(huì)以同樣的方式被移動(dòng)到老年代中。也就是等級(代)越高,被垃圾回收機(jī)制掃描的頻率越低

回收:

回收依然是使用引用計(jì)數(shù)作為回收的依據(jù)
Python語法垃圾回收機(jī)制原理解析

雖然分代回收可以起到提升效率的效果,但也存在一定的缺點(diǎn):

例如一個(gè)變量剛剛從新生代移入青春代,該變量的綁定關(guān)系就解除了,該變量應(yīng)該被回收,但青春代的掃描頻率低于新生代,所以該變量的回收就會(huì)被延遲。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI