溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python垃圾回收機制的案例分析

發(fā)布時間:2020-11-02 11:55:16 來源:億速云 閱讀:158 作者:小新 欄目:編程語言

Python垃圾回收機制的案例分析?這個問題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容,讓我們一起來看看吧!

1、垃圾回收

引用計數(shù)器為主、分代碼回收和標記清除為輔

1.1 大管家refchain

在Python的C源碼中有一個名為refchain的環(huán)狀雙向鏈表,這個鏈表比較牛逼了,因為Python程序中一旦創(chuàng)建對象都會把這個對象添加到refchain這個鏈表中。也就是說他保存著所有的對象。

1.2 引用計數(shù)器

  • 在refchain中的所有對象內(nèi)部都有一個ob_refcnt用來保存當(dāng)前對象的引用計數(shù)器,顧名思義就是自己被引用的次數(shù)。
  • 當(dāng)值被多次引用時候,不會在內(nèi)存中重復(fù)創(chuàng)建數(shù)據(jù),而是引用計數(shù)器+1 。 當(dāng)對象被銷毀時候同時會讓引用計數(shù)器-1,如果引用計數(shù)器為0,則將對象從refchain鏈表中摘除,同時在內(nèi)存中進行銷毀(暫不考慮緩存等特殊情況)。
age = 18number = age  # 對象18的引用計數(shù)器 + 1del age          # 對象18的引用計數(shù)器 - 1def run(arg):
    print(arg)
run(number)   # 剛開始執(zhí)行函數(shù)時,對象18引用計數(shù)器 + 1,當(dāng)函數(shù)執(zhí)行完畢之后,對象18引用計數(shù)器 - 1 。num_list = [11,22,number] # 對象18的引用計數(shù)器 + 1復(fù)制代碼

1.3 標記清除&分代回收

基于引用計數(shù)器進行垃圾回收非常方便和簡單,但他還是存在循環(huán)引用的問題,導(dǎo)致無法正常的回收一些數(shù)據(jù),例如:

v1 = [11,22,33]        # refchain中創(chuàng)建一個列表對象,由于v1=對象,所以列表引對象用計數(shù)器為1.v2 = [44,55,66]        # refchain中再創(chuàng)建一個列表對象,因v2=對象,所以列表對象引用計數(shù)器為1.v1.append(v2)        # 把v2追加到v1中,則v2對應(yīng)的[44,55,66]對象的引用計數(shù)器加1,最終為2.v2.append(v1)        # 把v1追加到v1中,則v1對應(yīng)的[11,22,33]對象的引用計數(shù)器加1,最終為2.del v1    # 引用計數(shù)器-1del v2    # 引用計數(shù)器-1復(fù)制代碼
  • 對于上述代碼會發(fā)現(xiàn),執(zhí)行del操作之后,沒有變量再會去使用那兩個列表對象,但由于循環(huán)引用的問題,他們的引用計數(shù)器不為0,所以他們的狀態(tài):永遠不會被使用、也不會被銷毀。項目中如果這種代碼太多,就會導(dǎo)致內(nèi)存一直被消耗,直到內(nèi)存被耗盡,程序崩潰。
  • 為了解決循環(huán)引用的問題,引入了標記清除技術(shù),專門針對那些可能存在循環(huán)引用的對象進行特殊處理,可能存在循環(huán)應(yīng)用的類型有:列表、元組、字典、集合、自定義類等那些能進行數(shù)據(jù)嵌套的類型。

標記清除:創(chuàng)建特殊鏈表專門用于保存 列表、元組、字典、集合、自定義類等對象,之后再去檢查這個鏈表中的對象是否存在循環(huán)引用,如果存在則讓雙方的引用計數(shù)器均 - 1 。

分代回收:對標記清除中的鏈表進行優(yōu)化,將那些可能存在循引用的對象拆分到3個鏈表,鏈表稱為:0/1/2三代,每代都可以存儲對象和閾值,當(dāng)達到閾值時,就會對相應(yīng)的鏈表中的每個對象做一次掃描,除循環(huán)引用各自減1并且銷毀引用計數(shù)器為0的對象。

// 分代的C源碼#define NUM_GENERATIONS 3struct gc_generation generations[NUM_GENERATIONS] = {    /* PyGC_Head,                                    threshold,    count */
    {{(uintptr_t)_GEN_HEAD(0), (uintptr_t)_GEN_HEAD(0)},   700,        0}, // 0代
    {{(uintptr_t)_GEN_HEAD(1), (uintptr_t)_GEN_HEAD(1)},   10,         0}, // 1代
    {{(uintptr_t)_GEN_HEAD(2), (uintptr_t)_GEN_HEAD(2)},   10,         0}, // 2代};復(fù)制代碼

特別注意:0代和1、2代的threshold和count表示的意義不同。

0代,count表示0代鏈表中對象的數(shù)量,threshold表示0代鏈表對象個數(shù)閾值,超過則執(zhí)行一次0代掃描檢查。 1代,count表示0代鏈表掃描的次數(shù),threshold表示0代鏈表掃描的次數(shù)閾值,超過則執(zhí)行一次1代掃描檢查。 2代,count表示1代鏈表掃描的次數(shù),threshold表示1代鏈表掃描的次數(shù)閾值,超過則執(zhí)行一2代掃描檢查。

1.4 情景模擬

根據(jù)C語言底層并結(jié)合圖來講解內(nèi)存管理和垃圾回收的詳細過程。

第一步:當(dāng)創(chuàng)建對象age=19時,會將對象添加到refchain鏈表中。

Python垃圾回收機制的案例分析

第二步:當(dāng)創(chuàng)建對象num_list = [11,22]時,會將列表對象添加到 refchain 和 generations 0代中。

Python垃圾回收機制的案例分析

第三步:新創(chuàng)建對象使generations的0代鏈表上的對象數(shù)量大于閾值700時,要對鏈表上的對象進行掃描檢查。

當(dāng)0代大于閾值后,底層不是直接掃描0代,而是先判斷2、1是否也超過了閾值。

  • 如果2、1代未達到閾值,則掃描0代,并讓1代的 count + 1 。
  • 如果2代已達到閾值,則將2、1、0三個鏈表拼接起來進行全掃描,并將2、1、0代的count重置為0.
  • 如果1代已達到閾值,則講1、0兩個鏈表拼接起來進行掃描,并將所有1、0代的count重置為0.

對拼接起來的鏈表在進行掃描時,主要就是剔除循環(huán)引用和銷毀垃圾,詳細過程為:

  • 掃描鏈表,把每個對象的引用計數(shù)器拷貝一份并保存到 gc_refs中,保護原引用計數(shù)器。
  • 再次掃描鏈表中的每個對象,并檢查是否存在循環(huán)引用,如果存在則讓各自的gc_refs減 1 。
  • 再次掃描鏈表,將 gc_refs 為 0 的對象移動到unreachable鏈表中;不為0的對象直接升級到下一代鏈表中。
  • 處理unreachable鏈表中的對象的 析構(gòu)函數(shù) 和 弱引用,不能被銷毀的對象升級到下一代鏈表,能銷毀的保留在此鏈表。析構(gòu)函數(shù),指的就是那些定義了__del__方法的對象,需要執(zhí)行之后再進行銷毀處理。
  • 最后將 unreachable 中的每個對象銷毀并在refchain鏈表中移除(不考慮緩存機制)。

至此,垃圾回收的過程結(jié)束。

1.5 緩存機制

從上文大家可以了解到當(dāng)對象的引用計數(shù)器為0時,就會被銷毀并釋放內(nèi)存。而實際上他不是這么的簡單粗暴,因為反復(fù)的創(chuàng)建和銷毀會使程序的執(zhí)行效率變低。Python中引入了“緩存機制”機制。

例如:引用計數(shù)器為0時,不會真正銷毀對象,而是將他放到一個名為 free_list 的鏈表中,之后會再創(chuàng)建對象時不會在重新開辟內(nèi)存,而是在free_list中將之前的對象來并重置內(nèi)部的值來使用。

  • float類型,維護的free_list鏈表最多可緩存100個float對象。
  v1 = 3.14    # 開辟內(nèi)存來存儲float對象,并將對象添加到refchain鏈表。
  print( id(v1) ) # 內(nèi)存地址:4436033488
  del v1    # 引用計數(shù)器-1,如果為0則在rechain鏈表中移除,不銷毀對象,而是將對象添加到float的free_list.
  v2 = 9.999    # 優(yōu)先去free_list中獲取對象,并重置為9.999,如果free_list為空才重新開辟內(nèi)存。
  print( id(v2) ) # 內(nèi)存地址:4436033488
  # 注意:引用計數(shù)器為0時,會先判斷free_list中緩存?zhèn)€數(shù)是否滿了,未滿則將對象緩存,已滿則直接將對象銷毀。復(fù)制代碼
  • int類型,不是基于free_list,而是維護一個small_ints鏈表保存常見數(shù)據(jù)(小數(shù)據(jù)池),小數(shù)據(jù)池范圍:-5 <= value < 257。即:重復(fù)使用這個范圍的整數(shù)時,不會重新開辟內(nèi)存。
  v1 = 38    # 去小數(shù)據(jù)池small_ints中獲取38整數(shù)對象,將對象添加到refchain并讓引用計數(shù)器+1。
  print( id(v1))  #內(nèi)存地址:4514343712
  v2 = 38 # 去小數(shù)據(jù)池small_ints中獲取38整數(shù)對象,將refchain中的對象的引用計數(shù)器+1。
  print( id(v2) ) #內(nèi)存地址:4514343712
  # 注意:在解釋器啟動時候-5~256就已經(jīng)被加入到small_ints鏈表中且引用計數(shù)器初始化為1,
  # 代碼中使用的值時直接去small_ints中拿來用并將引用計數(shù)器+1即可。另外,small_ints中的數(shù)據(jù)引用計數(shù)器永遠不會為0
  # (初始化時就設(shè)置為1了),所以也不會被銷毀。復(fù)制代碼
  • str類型,維護unicode_latin1[256]鏈表,內(nèi)部將所有的ascii字符緩存起來,以后使用時就不再反復(fù)創(chuàng)建。
  v1 = "A"
  print( id(v1) ) # 輸出:4517720496
  del v1
  v2 = "A"
  print( id(v1) ) # 輸出:4517720496
  # 除此之外,Python內(nèi)部還對字符串做了駐留機制,針對只含有字母、數(shù)字、下劃線的字符串(見源碼Objects/codeobject.c),如果
  # 內(nèi)存中已存在則不會重新在創(chuàng)建而是使用原來的地址里(不會像free_list那樣一直在內(nèi)存存活,只有內(nèi)存中有才能被重復(fù)利用)。
  v1 = "asdfg"
  v2 = "asdfg"
  print(id(v1) == id(v2)) # 輸出:True復(fù)制代碼
  • list類型,維護的free_list數(shù)組最多可緩存80個list對象。

 v1 = [11,22,33]
print( id(v1) ) # 輸出:4517628816del v1
v2 = ["你","好"]
print( id(v2) ) # 輸出:4517628816復(fù)制代碼
  • tuple類型,維護一個free_list數(shù)組且數(shù)組容量20,數(shù)組中元素可以是鏈表且每個鏈表最多可以容納2000個元組對象。元組的free_list數(shù)組在存儲數(shù)據(jù)時,是按照元組可以容納的個數(shù)為索引找到free_list數(shù)組中對應(yīng)的鏈表,并添加到鏈表中。
v1 = (1,2)
print( id(v1) )del v1  # 因元組的數(shù)量為2,所以會把這個對象緩存到free_list[2]的鏈表中。v2 = ("哈哈哈","Alex")  # 不會重新開辟內(nèi)存,而是去free_list[2]對應(yīng)的鏈表中拿到一個對象來使用。print( id(v2) )復(fù)制代碼
  • dict類型,維護的free_list數(shù)組最多可緩存80個dict對象
  v1 = {"k1":123}
  print( id(v1) )  # 輸出:4515998128
  del v1
  v2 = {"name":"哈哈哈","age":18,"gender":"男"}
  print( id(v1) ) # 輸出:4515998128復(fù)制代碼

C語言源碼底層分析

感謝各位的閱讀!看完上述內(nèi)容,你們對Python垃圾回收機制的案例分析大概了解了嗎?希望文章內(nèi)容對大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI