溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python中GIL的使用方法

發(fā)布時(shí)間:2021-01-29 16:01:19 來源:億速云 閱讀:156 作者:Leah 欄目:開發(fā)技術(shù)

Python中GIL的使用方法?相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。

GIL:又叫全局解釋器鎖,每個(gè)線程在執(zhí)行的過程中都需要先獲取GIL,保證同一時(shí)刻只有一個(gè)線程在運(yùn)行,目的是解決多線程同時(shí)競(jìng)爭(zhēng)程序中的全局變量而出現(xiàn)的線程安全問題。它并不是python語言的特性,僅僅是由于歷史的原因在CPython解釋器中難以移除,因?yàn)閜ython語言運(yùn)行環(huán)境大部分默認(rèn)在CPython解釋器中。

通過一個(gè)案例了解單線程和多線程的cpu占用率:

打開Ubuntu終端命令:輸入htop,回車,紅色箭頭指向的2代表此時(shí)我的虛擬機(jī)中CPU有兩個(gè)核心數(shù)

Python中GIL的使用方法

下面通過一個(gè)案例了解單線程死循環(huán)和多線程死循環(huán)的CPU占用率:

單線程死循環(huán).py: 

#coding=utf-8
while True:
  pass

運(yùn)行該程序,出現(xiàn)以下界面:

Python中GIL的使用方法

此時(shí)新開一個(gè)窗口,輸入htop,查看CPU占用率,其中一個(gè)CPU占用率幾乎為100%:

Python中GIL的使用方法

兩個(gè)線程死循環(huán).py

#coding=utf-8
import threading
 
#子線程死循環(huán)
def test():
  while True:
    pass
 
t1=threading.Thread(target=test)
t1.start()
 
#主線程死循環(huán),
while True:
  pass

此時(shí)新開一個(gè)終端,輸入htop查看CPU占用率,可以看到兩個(gè)CPU任何一個(gè)并沒有全部占滿,而是交替執(zhí)行的:

Python中GIL的使用方法

 這也就驗(yàn)證了多線程下每個(gè)線程在執(zhí)行的過程中都需要先獲取GIL,保證同一時(shí)刻只有一個(gè)線程在運(yùn)行。

由于GIL的存在,即使是多線程,事實(shí)上同一時(shí)刻只能保證一個(gè)線程在運(yùn)行,既然這樣多線程的運(yùn)行效率不就和單線程一樣了嗎,那為什么還要使用多線程呢?

由于以前的電腦基本都是單核CPU,多線程和單線程幾乎看不出差別,可是由于計(jì)算機(jī)的迅速發(fā)展,現(xiàn)在的電腦幾乎都是多核CPU了,最少也是兩個(gè)核心數(shù)的,這時(shí)差別就出來了:通過之前的案例我們已經(jīng)知道,即使在多核CPU中,多線程同一時(shí)刻也只有一個(gè)線程在運(yùn)行,這樣不僅不能利用多核CPU的優(yōu)勢(shì),反而由于每個(gè)線程在多個(gè)CPU上是交替執(zhí)行的,導(dǎo)致在不同CPU上切換時(shí)造成資源的浪費(fèi),反而會(huì)更慢。即原因是一個(gè)進(jìn)程只存在一把gil鎖,當(dāng)在執(zhí)行多個(gè)線程時(shí),內(nèi)部會(huì)爭(zhēng)搶gil鎖,這會(huì)造成當(dāng)某一個(gè)線程沒有搶到鎖的時(shí)候會(huì)讓cpu等待,進(jìn)而不能合理利用多核cpu資源。

例如在使用多線程抓取網(wǎng)頁(yè)內(nèi)容時(shí),遇到IO阻塞時(shí),正在執(zhí)行的線程會(huì)暫時(shí)釋放GIL鎖,這時(shí)其它線程會(huì)利用這個(gè)空隙時(shí)間,執(zhí)行自己的代碼,因此多線程抓取比單線程抓取性能要好。

說到在這里要先介紹兩個(gè)概念:計(jì)算密集型和IO密集型

計(jì)算密集型:要進(jìn)行大量的數(shù)值計(jì)算,例如進(jìn)行上億的數(shù)字計(jì)算、計(jì)算圓周率、對(duì)視頻進(jìn)行高清解碼等等。這種計(jì)算密集型任務(wù)雖然也可以用多任務(wù)完成,但是花費(fèi)的主要時(shí)間在任務(wù)切換的時(shí)間,此時(shí)CPU執(zhí)行任務(wù)的效率比較低。

IO密集型:涉及到網(wǎng)絡(luò)請(qǐng)求(time.sleep())、磁盤IO的任務(wù)都是IO密集型任務(wù),這類任務(wù)的特點(diǎn)是CPU消耗很少,任務(wù)的大部分時(shí)間都在等待IO操作完成(因?yàn)镮O的速度遠(yuǎn)遠(yuǎn)低于CPU和內(nèi)存的速度)。對(duì)于IO密集型任務(wù),任務(wù)越多,CPU效率越高,但也有一個(gè)限度。

解決GIL問題的方案:

1.使用其它語言,例如C,Java

2.使用其它解釋器,如java的解釋器jython

3.使用多進(jìn)程

線程釋放GIL鎖的情況:

1.在IO操作等可能會(huì)引起阻塞的system call之前,可以暫時(shí)釋放GIL,但在執(zhí)行完畢后,必須重新獲取GIL。

2.Python 3.x使用計(jì)時(shí)器(執(zhí)行時(shí)間達(dá)到閾值后,當(dāng)前線程釋放GIL)或Python 2.x,tickets計(jì)數(shù)達(dá)到100。

GIL面試題參考答案:

  • Python語言和GIL沒有什么關(guān)系。僅僅是由于歷史原因在Cpython虛擬機(jī)(解釋器),難以移除GIL。

  • GIL:全局解釋器鎖。每個(gè)線程在執(zhí)行的過程都需要先獲取GIL,保證同一時(shí)刻只有一個(gè)線程可以執(zhí)行代碼。

  • 線程釋放GIL鎖的情況: 在IO操作等可能會(huì)引起阻塞的system call之前,可以暫時(shí)釋放GIL,但在執(zhí)行完畢后,必須重新獲取GIL Python 3.x使用計(jì)時(shí)器(執(zhí)行時(shí)間達(dá)到閾值后,當(dāng)前線程釋放GIL)或Python 2.x,tickets計(jì)數(shù)達(dá)到100。

  • Python使用多進(jìn)程是可以利用多核的CPU資源的。

  • 多線程爬取比單線程性能有提升,因?yàn)橛龅絀O阻塞會(huì)自動(dòng)釋放GIL鎖。

看完上述內(nèi)容,你們掌握Python中GIL的使用方法的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI