python爬蟲多線程加速爬取的方法

發(fā)布時間：2020-11-24 09:33:43 來源：億速云閱讀：206 作者：小新欄目：編程語言

這篇文章給大家分享的是有關python爬蟲多線程加速爬取的方法的內(nèi)容。小編覺得挺實用的，因此分享給大家做個參考。一起跟隨小編過來看看吧。

一、準備階段

python3 、多線程庫、第三方庫 requests的安裝以及調用

二、線程分析圖示：

python爬蟲多線程加速爬取的方法

三、多線程加速實現(xiàn)代碼演示

import requests
from threading import Thread,current_thread
def parse_page(res):
 print('%s 解析 %s' %(current_thread().getName(),len(res)))
def get_page(url,callback=parse_page):
 print('%s 下載 %s' %(current_thread().getName(),url))
 response=requests.get(url)
 if response.status_code == 200:
 callback(response.text)
if __name__ == '__main__':
 urls=['鏈接']
 for url in urls:
 t=Thread(target=get_page,args=(url,))
 t.start()

感謝各位的閱讀！關于python爬蟲多線程加速爬取的方法就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，讓大家可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到吧！

向AI問一下細節(jié)

python爬蟲多線程加速爬取的方法

猜你喜歡

最新資訊

相關推薦

相關標簽