您好,登錄后才能下訂單哦!
小編給大家分享一下Python全局鎖中合理運用多線程的示例,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
Python全局鎖
(1)全局鎖導致的問題
全局鎖的英文簡稱是GIL,全稱是Global Interpreter Lock(全局解釋器鎖),來源是python設計之初的考慮,為了數(shù)據(jù)安全所做的決定,每個線程在執(zhí)行時候都需要先獲取GIL,保證同一時刻只有一個線程可以執(zhí)行代碼,即同一時刻只有一個線程使用CPU,也就是說多線程并不是真正意義上的同時執(zhí)行。
每個CPU在同一時間只能執(zhí)行一個線程(在單核CPU下的多線程其實都只是并發(fā),不是并行,并發(fā)和并行從宏觀上來講都是同時處理多路請求的概念。但并發(fā)和并行又有區(qū)別,并行是指兩個或者多個事件在同一時刻發(fā)生(多個CPU同時執(zhí)行某個任務);而并發(fā)是指兩個或多個事件在同一時間間隔內發(fā)生。)
在Python多線程下,每個線程的執(zhí)行方式:
1、獲取GIL
2、執(zhí)行代碼直到sleep或者是python虛擬機將其掛起。
3、釋放GIL
可見,某個線程想要執(zhí)行,必須先拿到GIL,我們可以把GIL看作是“通行證”,并且在一個python進程中,GIL只有一個。拿不到通行證的線程,就不允許進入CPU執(zhí)行。
在Python2.x里,GIL的釋放邏輯是當前線程遇見IO操作或者ticks計數(shù)達到100(ticks可以看作是Python自身的一個計數(shù)器,專門做用于GIL,每次釋放后歸零,這個計數(shù)可以通過 sys.setcheckinterval 來調整),進行釋放。
而每次釋放GIL鎖,線程進行鎖競爭、切換線程,會消耗資源。并且由于GIL鎖存在,python里一個進程永遠只能同時執(zhí)行一個線程(拿到GIL的線程才能執(zhí)行),這就是為什么在多核CPU上,python的多線程效率并不高。
(2)在有全局鎖的情況下如何運行多線程、多進程
在這里我們進行分類討論:
1、CPU密集型代碼(各種循環(huán)處理、計數(shù)等等),在這種情況下,由于計算工作多,ticks計數(shù)很快就會達到閾值,然后觸發(fā)GIL的釋放與再競爭(多個線程來回切換當然是需要消耗資源的),所以python下的多線程對CPU密集型代碼并不友好,此時可以采用多進程形式實現(xiàn)多任務。
2、IO密集型代碼(文件處理、網(wǎng)絡爬蟲等),多線程能夠有效提升效率(單線程下有IO操作會進行IO等待,造成不必要的時間浪費,而開啟多線程能在線程A等待時,自動切換到線程B,可以不浪費CPU的資源,從而能提升程序執(zhí)行效率)。所以python的多線程對IO密集型代碼比較友好。
而在python3.x中,GIL不使用ticks計數(shù),改為使用計時器(執(zhí)行時間達到閾值后,當前線程釋放GIL),這樣對CPU密集型程序更加友好,但依然沒有解決GIL導致的同一時間只能執(zhí)行一個線程的問題,所以效率依然不盡如人意。
請注意:多核多線程比單核多線程更差,原因是單核下多線程,每次釋放GIL,喚醒的那個線程都能獲取到GIL鎖,所以能夠無縫執(zhí)行,但多核下,CPU0釋放GIL后,其他CPU上的線程都會進行競爭,但GIL可能會馬上又被CPU0拿到,導致其他幾個CPU上被喚醒后的線程會醒著等待到切換時間后又進入待調度狀態(tài),這樣會造成線程顛簸(thrashing),導致效率更低
回到最開始的問題:經(jīng)常我們會聽到老手說:“python下想要充分利用多核CPU,就用多進程”,原因是什么呢?
原因是:每個進程有各自獨立的GIL,互不干擾,這樣就可以真正意義上的并行執(zhí)行,所以在python中,多進程的執(zhí)行效率優(yōu)于多線程(僅僅針對多核CPU而言)。
(3)代碼實例
使用一個線程去計數(shù)
#encoing:utf-8 import threading import time def test_counter(): i = 0 for _ in range(100000000): i += 1 return True def main(): start_time = time.time() for tid in range(2): t1 = threading.Thread(target=test_counter) t1.start() t1.join() end_time = time.time() print("Total time:{}".format(end_time-start_time)) if __name__ == "__main__": main()
結果:
使用2個線程,去執(zhí)行非IO操作
#encoding:utf-8 import threading import time def test_counter(): i = 0 for _ in range(100000000): i += 1 return True def main(): thread_array = {} start_time = time.time() for tid in range(2): t = threading.Thread(target=test_counter) t.start() thread_array[tid] = t for i in range(2): thread_array[i].join() end_time = time.time() print("Total time:{}".format(end_time-start_time)) if __name__ == "__main__": main()
結果:
通過上面的代碼可以得出,對于非IO類型操作,多線程為了獲得GIL去相互競爭,導致程序執(zhí)行效率更低,所以我們要根據(jù)實際的業(yè)務功能情況,來確定使用多線程、多進程!
看完了這篇文章,相信你對“Python全局鎖中合理運用多線程的示例”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。