Python中垃圾回收機制的原理是什么

發(fā)布時間：2021-07-10 14:23:28 來源：億速云閱讀：227 作者：Leah 欄目：編程語言

Python中垃圾回收機制的原理是什么，很多新手對此不是很清楚，為了幫助大家解決這個難題，下面小編將為大家詳細講解，有這方面需求的人可以來學(xué)習(xí)下，希望你能有所收獲。

垃圾回收機制

「垃圾回收（GC）」 大家應(yīng)該多多少少都了解過，什么是垃圾回收呢？垃圾回收GC的全拼是 Garbage Collection，在維基百科的定義是：在計算機科學(xué)中，垃圾回收（英語：Garbage Collection，縮寫為GC）是一種自動的內(nèi)存管理機制。當(dāng)一個電腦上的動態(tài)內(nèi)存不再需要時，就應(yīng)該予以釋放，以讓出內(nèi)存，這種內(nèi)存資源管理，稱為垃圾回收。我們都知道在C/C++里用戶需要自己管理維護內(nèi)存，自己管理內(nèi)存是很自由，可以隨意申請、釋放內(nèi)存，但是極易會出現(xiàn)內(nèi)存泄露，懸空指針等問題；像現(xiàn)在的高級語言Java，Python等，都采用了垃圾回收機制，自動進行內(nèi)存管理，而垃圾回收機制專注于兩件事：「① 找到內(nèi)存中無用的垃圾資源?！?/strong> 「② 清除這些垃圾資源并把內(nèi)存讓出來給其他對象使用?！?/strong>

Python作為一門解釋型語言，因為簡單易懂的語法，我們可以直接對變量賦值，而不必聲明變量的類型，變量類型的確定、內(nèi)存空間的分配與釋放都是由Python解釋器在運行時自動進行的，我們不必關(guān)心；Python這一自動管理內(nèi)存的功能極大的減少了開發(fā)者的編碼負(fù)擔(dān)，讓開發(fā)者專注于業(yè)務(wù)實現(xiàn)，這也是成就Python自身的重要原因之一。接下來，我們就扒一扒python的內(nèi)存管理。

引用計數(shù)機制

Python中一切皆對象，也就是說，在Python中你用到的一切變量，本質(zhì)上都是類對象。實際上每一個對象的核心就是一個「結(jié)構(gòu)體PyObject」，它的內(nèi)部有一個引用計數(shù)器ob_refcnt，程序在運行的過程中會實時的更新ob_refcnt的值，來反映引用當(dāng)前對象的名稱數(shù)量。當(dāng)某對象的引用計數(shù)值為0,說明這個對象變成了垃圾，那么它會被回收掉，它所用的內(nèi)存也會被立即釋放掉。

typedef struct _object {
    int ob_refcnt;//引用計數(shù)
    struct _typeobject *ob_type;
} PyObject;

以下情況是導(dǎo)致引用計數(shù)加一的情況:
對象被創(chuàng)建，例如a=5
對象被引用，b=a
對象被作為參數(shù)，傳入到一個函數(shù)中（要注意的是，在函數(shù)調(diào)用發(fā)生的時候，會產(chǎn)生額外的兩次引用，一次來自函數(shù)棧，另一個是函數(shù)參數(shù)）
對象作為一個元素，存儲在容器中（例如存儲在列表中）

下面的情況則會導(dǎo)致引用計數(shù)減一:
對象別名被顯示銷毀 del a
對象別名被賦予新的對象
一個對象離開它的作用域
對象所在的容器被銷毀或者是從容器中刪除對象

我們還可以通過sys包中的getrefcount()來獲取一個名稱所引用的對象當(dāng)前的引用計數(shù)(注意，這里getrefcount()本身會使得引用計數(shù)加一)

import sys
a = [1, 2, 3]
print(sys.getrefcount(a))# 輸出為2，說明有兩次引用（一次來自a的定義，一次來自getrefcount）def func(a):    print(sys.getrefcount(a))
    # 輸出為4，說明有四次引用（a的定義、Python的函數(shù)調(diào)用棧，函數(shù)參數(shù)，和getrefcount）func(a)
print(sys.getrefcount(a))# 輸出為2，說明有兩次引用（一次來自a的定義，一次來自getrefcount），此時函數(shù)func調(diào)用已經(jīng)不存在

下面從使用內(nèi)存的角度看一下：

import osimport psutildef show_memory_info(hint):    """
    顯示當(dāng)前 python 程序占用的內(nèi)存大小
    :param hint:
    :return:
    """    pid = os.getpid()
    p = psutil.Process(pid)

    info = p.memory_full_info()
    memory = info.rss / 1024 / 1024    print('{} 當(dāng)前進程的內(nèi)存使用: {} MB'.format(hint, memory))def func():    show_memory_info('初始')
    a = [i for i in range(9999999)]
    show_memory_info('創(chuàng)建a之后')


func()
show_memory_info('結(jié)束')

輸出如下：

初始 當(dāng)前進程的內(nèi)存使用: 12.125 MB
創(chuàng)建a之后 當(dāng)前進程的內(nèi)存使用: 205.15625 MB
結(jié)束 當(dāng)前進程的內(nèi)存使用: 12.87890625 MB

可以看出，當(dāng)前進程初始的內(nèi)存使用為12.125 MB，當(dāng)調(diào)用了函數(shù)func()創(chuàng)建列表a之后，內(nèi)存占用迅速增加到了205.15625 MB，而在函數(shù)調(diào)用結(jié)束后，內(nèi)存則返回正常。這是因為，函數(shù)內(nèi)部聲明的列表a是局部變量，在函數(shù)返回后，局部變量的引用會注銷掉，此時列表a所指代對象的引用計數(shù)為0，Python 便會執(zhí)行垃圾回收，因此之前占用的大量內(nèi)存就又回來了。

循環(huán)引用

何為循環(huán)引用？簡單來說就是兩個對象相互引用?？聪旅嬉欢纬绦颍?/p>

def func2():
    show_memory_info('初始')
    a = [i for i in range(10000000)]
    b = [x for x in range(10000001, 20000000)]
    a.append(b)
    b.append(a)
    show_memory_info('創(chuàng)建a,b之后')

func2()
show_memory_info('結(jié)束')

輸出如下：

初始 當(dāng)前進程的內(nèi)存使用: 12.14453125 MB
創(chuàng)建a,b之后 當(dāng)前進程的內(nèi)存使用: 396.6875 MB
結(jié)束 當(dāng)前進程的內(nèi)存使用: 396.96875 MB

可以看出，在程序中，a和b互相引用，并且作為局部變量在函數(shù)func2調(diào)用結(jié)束后，a和b從程序意義上已經(jīng)不存在，但從輸出結(jié)果中看到，依然有內(nèi)存占用，這是為什么呢？因為互相引用導(dǎo)致它們的引用數(shù)都不為0。

如果在生產(chǎn)環(huán)境下出現(xiàn)了循環(huán)引用，又沒有其他垃圾回收機制的情況下，經(jīng)過長時間運行后，程序所占用的內(nèi)存一定會變得越來越大，如果沒有被及時處理，一定會跑滿服務(wù)器的。

如果不得不使用循環(huán)引用的話，我們可以顯式調(diào)用「gc.collect()」 來啟動垃圾回收：

def func2():
    show_memory_info('初始')
    a = [i for i in range(10000000)]
    b = [x for x in range(10000001, 20000000)]
    a.append(b)
    b.append(a)
    show_memory_info('創(chuàng)建a,b之后')

func2()
gc.collect()
show_memory_info('結(jié)束')

輸出如下：

初始 當(dāng)前進程的內(nèi)存使用: 12.29296875 MB
創(chuàng)建a,b之后 當(dāng)前進程的內(nèi)存使用: 396.69140625 MB
結(jié)束 當(dāng)前進程的內(nèi)存使用: 12.95703125 MB

引用計數(shù)機制有高效、簡單、實時性（一旦為零就直接做掉）等優(yōu)點，一旦一個對象的引用計數(shù)歸零，內(nèi)存就直接釋放了。不用像其他機制等到特定時機。將垃圾回收隨機分配到運行的階段，處理回收內(nèi)存的時間分?jǐn)偟搅似綍r，正常程序的運行比較平穩(wěn)。但是，引用計數(shù)也存在著一些缺點，通常的缺點有：

① 邏輯雖然簡單，但維護起來有些麻煩。每個對象需要分配單獨的空間來統(tǒng)計引用計數(shù)，并且需要對引用計數(shù)進行維護，這是需要消耗一下資源的。
② 循環(huán)引用。這將是引用計數(shù)機制的致命傷，引用計數(shù)對此是無解的，因此必須要使用其它的垃圾回收算法對其進行補充。

事實上，Python 使用標(biāo)記清除（mark-sweep）算法和分代收集（generational），來啟用針對循環(huán)引用的自動垃圾回收。

標(biāo)記清除解除循環(huán)引用

Python采用了 「標(biāo)記-清除(Mark and Sweep)算法」，解決容器對象可能產(chǎn)生的循環(huán)引用問題。(注意，只有容器類對象才有可能產(chǎn)生循環(huán)引用，比如列表、字典、用戶自定義類的對象、元組等。而像數(shù)字，字符串這類簡單類型不會出現(xiàn)循環(huán)引用。作為一種優(yōu)化策略，對于只包含簡單類型的元組也不在標(biāo)記清除算法的考慮之列)
它分為兩個階段：第一階段是標(biāo)記階段，GC會把所有的「活動對象」打上標(biāo)記，第二階段是把那些沒有標(biāo)記的「非活動對象」進行回收。
那么Python又是如何判斷什么樣的對象為非活動對象的呢？
對于任何對象集合，我們先建個引用計數(shù)副本表，來存它們的引用計數(shù)，然后把集合內(nèi)部的引用都解除掉（內(nèi)部引用是指這個集合中的某個對象引用了本集合內(nèi)部的另一個對象），解除的過程中在副本表減少引用計數(shù)，解除掉所有的內(nèi)部引用后，在副本表引用計數(shù)依然不為0的，就是根集合，然后開始標(biāo)記過程，即從跟集合節(jié)點逐步恢復(fù)引用并增加副本表的引用計數(shù)，最后副本表中引用計數(shù)為0的，就是垃圾對象了，我們就需要對它們進行垃圾回收。例如：

上面這個集合中的節(jié)點有外部進來的連接（到a和到b），也有到外部的連接（c引用了外面某個對象），右邊是引用計數(shù)表，然后我們拆掉所有內(nèi)部連接：

那么根集合就是a和b了，然后我們從a和b出發(fā)開始標(biāo)記并恢復(fù)引用計數(shù)：

從a和b出發(fā)可達的節(jié)點都被恢復(fù)了，引用計數(shù)還是0的就是這個集合內(nèi)部循環(huán)引用的垃圾（e和f），如果把所有對象看做一個集合，那么可以回收所有垃圾，也可以將所有對象劃分成一個個小的集合，分別回收小集合內(nèi)的垃圾。
但是每次都需要遍歷圖，對于Python而言是一種巨大的性能浪費。

分代回收

分代回收是一種以空間換時間的操作方式，Python將內(nèi)存根據(jù)對象的存活時間劃分為不同的集合，每個集合稱為一個代，Python將內(nèi)存分為了3代，分別為年輕代(第0代)、中年代(第1代)、老年代(第2代)。它們對應(yīng)3個鏈表，它們的垃圾收集頻率隨對象的存活時間的增大而減小。
新創(chuàng)建的對象都會分配在年輕代，年輕代鏈表的總數(shù)達到上限時，即當(dāng)垃圾回收器中新增對象減去刪除對象達到相應(yīng)的閾值時，就會對這一代對象啟動垃圾回收，把那些可以被回收的對象回收掉，而那些不會回收的對象就會被移到中年代去，依此類推，老年代中的對象是存活時間最久的對象，甚至是存活于整個系統(tǒng)的生命周期內(nèi)。同時，分代回收是建立在標(biāo)記清除技術(shù)基礎(chǔ)之上。事實上，分代回收基于的思想是，新生的對象更有可能被垃圾回收，而存活更久的對象也有更高的概率繼續(xù)存活。因此，通過這種做法，可以節(jié)約不少計算量，從而提高Python的性能。

看完上述內(nèi)容是否對您有幫助呢？如果還想對相關(guān)知識有進一步的了解或閱讀更多相關(guān)文章，請關(guān)注億速云行業(yè)資訊頻道，感謝您對億速云的支持。

向AI問一下細節(jié)

推薦閱讀：

Python中的垃圾回收機制的工作原理是什么

Python垃圾回收機制的原理

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

python

上一篇新聞：
python中怎么實現(xiàn)回文

下一篇新聞：
如何使用區(qū)塊鏈解決deepfake問題

猜你喜歡

電腦沒聲音小喇叭打叉怎么解決

mongodb開啟auth認(rèn)證失敗怎么解決

pycharm找不到mongodb插件怎么解決

win11怎么設(shè)置每天定時關(guān)機

win11沒聲音了怎么恢復(fù)

win11電腦沒聲音小喇叭打叉如何解決

怎么取消電腦的自動關(guān)機

linux下mongodb備份數(shù)據(jù)庫的方法是什么

mongodb時間范圍查詢很慢怎么解決

java如何防止定時任務(wù)未執(zhí)行完成

最新資訊

PHP日志記錄如何避免Log4j類似漏洞

PHP日志管理策略調(diào)整防范Log4j風(fēng)險

Log4j事件對PHP日志安全的影響分析

PHP日志系統(tǒng)如何預(yù)防遠程代碼執(zhí)行

PHP日志處理Log4j之外的安心之選

Log4j漏洞后PHP日志審計要點

PHP日志管理新方向：后Log4j時代

PHP項目如何確保日志安全非Log4j

PHP日志記錄策略調(diào)整應(yīng)對Log4j

Log4j漏洞啟示：PHP日志安全加固

相關(guān)推薦

PHP中垃圾回收機制的原理是什么

python中GIL的原理是什么

Java垃圾回收機制的原理是什么

Python中的垃圾回收機制是什么

PHP的垃圾回收機制的原理是什么

Python垃圾回收機制原理是什么

c#中垃圾回收機制的原理是什么

Python中垃圾回收機制的原理分析

JVM垃圾回收機制原理是什么

js垃圾回收機制的原理是什么

相關(guān)標(biāo)簽

pythonweb python3.7 python深拷貝 python入門 python文件操作 wxpython pythonpostgresql python列表推導(dǎo)式 python庫 python編譯器 python運算符 python面試升級python python 網(wǎng)絡(luò)編程 python切片 python正則 python環(huán)境變量 python運維 python語句 python游戲