溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么掌握Python的垃圾回收機制

發(fā)布時間:2023-05-09 11:17:45 來源:億速云 閱讀:110 作者:zzz 欄目:編程語言

這篇文章主要講解了“怎么掌握Python的垃圾回收機制”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“怎么掌握Python的垃圾回收機制”吧!

得益于 Python 的自動垃圾回收機制,在 Python 中創(chuàng)建對象時無須手動釋放。這對開發(fā)者非常友好,讓開發(fā)者無須關注低層內存管理。但如果對其垃圾回收機制不了解,很多時候寫出的 Python 代碼會非常低效。

垃圾回收算法有很多,主要有: 引用計數(shù)標記-清除 、 分代收集 等。

python 中,垃圾回收算法以 引用計數(shù) 為主, 標記-清除分代收集 兩種機制為輔。

1 引用計數(shù)

1.1 引用計數(shù)算法原理

引用計數(shù)原理比較簡單:

每個對象有一個整型的引用計數(shù)屬性。用于記錄對象被引用的次數(shù)。例如對象 A ,如果有一個對象引用了 A ,則 A 的引用計數(shù) +1 。當引用刪除時, A 的引用計數(shù) -1 。當 A 的引用計數(shù)為0時,即表示對象 A 不可能再被使用,直接回收。

Python 中,可以通過 sys 模塊的 getrefcount 函數(shù)獲取指定對象的引用計數(shù)器的值,我們以實際例子來看。

import sys

class A():
    def __init__(self):
        pass
        
a = A()
print(sys.getrefcount(a))

運行上面代碼,可以得到輸出結果為 2

1.2 計數(shù)器增減條件

上面我們看到,創(chuàng)建一個 A 對象,并將對象賦值給 a 變量后,對象的引用計數(shù)器值為 2 。那么什么時候計數(shù)器會 +1 ,什么時候計數(shù)器會 -1 呢?

1.2.1 引用計數(shù)+1的條件
A()
a=A()
func(a)
arr=[a,a]
1.2.2 引用計數(shù)-1的條件

對象被顯式銷毀,如 del a 。變量重新賦予新的對象,例如 a=0 。對象離開它的作用域,如 func 函數(shù)執(zhí)行完畢時, func 函數(shù)中的局部變量(全局變量不會)。

對象所在的容器被銷毀,或從容器中刪除對象。

1.2.3 代碼實戰(zhàn)

為了更好的理解計數(shù)器的增減,我們運行實際代碼,一目了然。

import sys
 
class A():

    def __init__(self):
        pass
 
print("創(chuàng)建對象 0 + 1 =", sys.getrefcount(A()))

a = A()
print("創(chuàng)建對象并賦值 0 + 2 =", sys.getrefcount(a))

b = a
c = a
print("賦給2個變量 2 + 2 =", sys.getrefcount(a))

b = None
print("變量重新賦值 4 - 1 =", sys.getrefcount(a))

del c
print("del對象 3 - 1 =", sys.getrefcount(a))

d = [a, a, a]
print("3次加入列表 2 + 3 =", sys.getrefcount(a))


def func(c):
    print('傳入函數(shù) 1 + 2 = ', sys.getrefcount(c))
func(A())

輸出結果如下:

創(chuàng)建對象 0 + 1 = 1
創(chuàng)建對象并賦值 0 + 2 = 2
賦給2個變量 2 + 2 = 4
變量重新賦值 4 - 1 = 3
del對象 3 - 1 = 2
3次加入列表 2 + 3 = 5
傳入函數(shù) 1 + 2 =  3
1.3 引用計數(shù)的優(yōu)點與缺點
1.3.1 引用計數(shù)優(yōu)點
  • 高效、邏輯簡單,只需根據(jù)規(guī)則對計數(shù)器做加減法。

  • 實時性。一旦對象的計數(shù)器為零,就說明對象永遠不可能再被用到,無須等待特定時機,直接釋放內存。

1.3.2 引用計數(shù)缺點

需要為對象分配引用計數(shù)空間,增大了內存消耗。

當需要釋放的對象比較大時,如字典對象,需要對引用的所有對象循環(huán)嵌套調用,可能耗時比較長。

循環(huán)引用。 這是引用計數(shù)的致命傷,引用計數(shù)對此是無解的,因此必須要使用其它的垃圾回收算法對其進行補充。

怎么掌握Python的垃圾回收機制

2 標記-清除

上一小節(jié)提到,引用計數(shù)算法無法解決循環(huán)引用問題,循環(huán)引用的對象會導致大家的計數(shù)器永遠都不會等于 0 ,帶來無法回收的問題。

標記-清除 算法主要用于潛在的循環(huán)引用問題,該算法分為2步:

  1. 標記階段。將所有的對象看成圖的節(jié)點,根據(jù)對象的引用關系構造圖結構。從圖的根節(jié)點遍歷所有的對象,所有訪問到的對象被打上標記,表明對象是“可達”的。

  2. 清除階段。遍歷所有對象,如果發(fā)現(xiàn)某個對象沒有標記為“可達”,則就回收。

以具體代碼示例說明:

class A():
    def __init__(self):
        self.obj = None
 
def func():
    a = A()
    b = A()
    c = A()
    d = A()

    a.obj = b
    b.obj = a
    return [c, d]

e = func()

上面代碼中,a和b相互引用,e引用了c和d。整個引用關系如下圖所示

怎么掌握Python的垃圾回收機制

如果采用引用計數(shù)器算法,那么a和b兩個對象將無法被回收。而采用標記清除法,從根節(jié)點(即e對象)開始遍歷,c、d、e三個對象都會被標記為 可達 ,而a和b無法被標記。因此a和b會被回收。

這是讀者可能會有疑問,為什么確定根節(jié)點是e,而不會是a、b、c、d呢?這里就有講究了,什么樣的對象會被看成是根節(jié)點呢?一般而言,根節(jié)點的選取包括(但不限于)如下幾種:

  • 當前棧幀中的本地變量表中引用的對象,如各個線程被調用的方法堆棧中使用到的參數(shù)、 局部變量、 臨時變量等。

  • 全局靜態(tài)變量

  • ...

3 分代收集

3.1 分代收集原理

在執(zhí)行垃圾回收過程中,程序會被暫停,即 stop-the-world 。這里很好理解:你媽媽在打掃房間的時候,肯定不允許你在房間內到處丟垃圾,要不然永遠也無法打掃干凈。

為了減少程序的暫停時間,采用 分代回收 ( Generational Collection )降低垃圾收集耗時。

分代回收基于這樣的法則:

  1. 接大部分的對象生命周期短,大部分對象都是朝生夕滅。

  2. 經(jīng)歷越多次數(shù)的垃圾收集且活下來的對象,說明該對象越不可能是垃圾,應該越少去收集。

Python 中,對象一共有3種世代: G0 , G1 , G2

  1. 對象剛創(chuàng)建時為 G0 。

  2. 如果在一輪 GC 掃描中存活下來,則移至 G1 ,處于 G1 的對象被掃描次數(shù)會減少。

  3. 如果再次在掃描中活下來,則進入 G2 ,處于 G1 的對象被掃描次數(shù)將會更少。

3.2 觸發(fā)GC時機

當某世代中分配的對象數(shù)量與被釋放的對象之差達到某個閾值的時,將觸發(fā)對該代的掃描。當某世代觸發(fā)掃描時,比該世代年輕的世代也會觸發(fā)掃描。

那么這個閾值是多少呢?我們可以通過代碼查看或者修改,示例代碼如下

import gc
threshold = gc.get_threshold()
print("各世代的閾值:", threshold)

# 設置各世代閾值
# gc.set_threshold(threshold0[, threshold1[, threshold2]])
gc.set_threshold(800, 20, 20)

輸出結果如下:

各世代的閾值: (700, 10, 10)

感謝各位的閱讀,以上就是“怎么掌握Python的垃圾回收機制”的內容了,經(jīng)過本文的學習后,相信大家對怎么掌握Python的垃圾回收機制這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI