溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么使itertools.tee線程安全

發(fā)布時間:2021-12-21 10:33:52 來源:億速云 閱讀:105 作者:柒染 欄目:大數(shù)據(jù)

怎么使itertools.tee線程安全,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

我們說到了,   itertools.tee   不是線程安全的,并給出了一個例子,如下圖所示:     

怎么使itertools.tee線程安全  

在兩個線程里面同時運行分裂出來的生成器對象,就會導(dǎo)致報錯。

現(xiàn)在,你想看看itertools.tee的源代碼,但是你會發(fā)現(xiàn),在 PyCharm 里面,它的源代碼如下圖所示:

怎么使itertools.tee線程安全  

這是因為,在 CPython 中,itertools.tee底層是通過 C 語言實現(xiàn)的,所以你不能在 PyCharm 中看到它的源代碼。但是你可以通過閱讀 Python 的源代碼中的 Modules/itertoolsmodule.c 文件[1],找到它的實現(xiàn)算法。

導(dǎo)致問題的核心部分在如下圖所示的兩段代碼中:

怎么使itertools.tee線程安全  
怎么使itertools.tee線程安全  

大家看不懂也沒有關(guān)系,根據(jù)我上一篇文章中使用 Python 實現(xiàn)的簡化版本就足夠幫助理解了。

我們使用簡化版本來解釋其中線程不安全的地方:

def generator():
   for i in range(3):
       yield f'我是你第{i}個爺爺'

def split(g):
   value_list_1 = []
   value_list_2 = []
   def wrap(queue):
       while True:
           if not queue:
               try:
                   value = next(g)
               except StopIteration:
                   return
               value_list_1.append(value)
               value_list_2.append(value)
           yield queue.pop(0)
   g_1 = wrap(value_list_1)
   g_2 = wrap(value_list_2)
   return g_1, g_2

g = generator()
g_1, g_2 = split(g)
for value in g_1:
   print(value)

for value in g_2:
   print(value)
 

當(dāng)兩個線程同時運行到if not queue時,發(fā)現(xiàn)當(dāng)前各自的隊列都是空的,于是進入value = next(g)獲取下一個值。其中,線程 A 先進入那么幾毫秒。然后線程 B 進入value = next(g)。但由于此時線程 A 中的next(g)正在運行,尚未結(jié)束,線程 B 又跑來運行,于是就導(dǎo)致了報錯的發(fā)生。Python 中,生成器不是線程安全的。

那么如何讓itertools.tee分裂出來的多個生成器可以在多線程中運行呢?其關(guān)鍵因素就是讓value = next(g)這一行一次只能讓一個線程運行。所以我們可以通過加鎖來實現(xiàn)。

import itertools
from threading import Lock


class KingnameTee:
   def __init__(self, tee_obj, lock):
       self.tee_obj = tee_obj
       self.lock = lock

   def __iter__(self):
       return self

   def __next__(self):
       with self.lock:
           return next(self.tee_obj)

   def __copy__(self):
       return KingnameTee(self.tee_obj.__copy__(), self.lock)

def safe_tee(iterable, n=2):
   """tuple of n independent thread-safe iterators"""
   lock = Lock()
   return tuple(KingnameTee(tee_obj, lock) for tee_obj in itertools.tee(iterable, n))
 

我們來看看運行效果:

怎么使itertools.tee線程安全  

多線程完美運行。

看完上述內(nèi)容,你們掌握怎么使itertools.tee線程安全的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI