溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

發(fā)布時間:2021-07-26 11:36:23 來源:億速云 閱讀:160 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹了Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

爬蟲:一段自動抓取互聯(lián)網(wǎng)信息的程序,從互聯(lián)網(wǎng)上抓取對于我們有價值的信息,一般來說,Python爬蟲程序很多時候都要使用(飛豬IP)代理的IP地址來爬取程序,但是默認(rèn)的urlopen是無法使用代理的IP的,我就來分享一下Python爬蟲怎樣使用代理IP的經(jīng)驗(yàn)。

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

1、劃重點(diǎn),小編我用的是Python3哦,所以要導(dǎo)入urllib的request,然后我們調(diào)用ProxyHandler,它可以接收代理IP的參數(shù)。代理可以根據(jù)自己需要選擇,當(dāng)然免費(fèi)的也是有的,但是可用率可想而知的。(飛豬IP)

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

2、接著把IP地址以字典的形式放入其中,這個IP地址是我亂寫的,只是用來舉例。設(shè)置鍵為http,當(dāng)然有些是https的,然后后面就是IP地址以及端口號(9000),具體看你的IP地址是什么類型的,不同IP端口號可能不同根據(jù)你在飛豬提取的端口為準(zhǔn)。

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

3、接著再用build_opener()來構(gòu)建一個opener對象。

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

4、然后調(diào)用構(gòu)建好的opener對象里面的open方法來發(fā)生請求。實(shí)際上urlopen也是類似這樣使用內(nèi)部定義好的opener.open(),這里就相當(dāng)于我們自己重寫。

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

5、當(dāng)然了,如果我們使用install_opener(),就可以把之前自定義的opener設(shè)置成全局的。

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

6、設(shè)置成全局之后,如果我們再使用urlopen來發(fā)送請求,那么發(fā)送請求使用的IP地址就是代理IP,而不是本機(jī)的IP地址了。

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

7、最后再來說說使用代理遇到的錯誤,提示目標(biāo)計算機(jī)積極拒絕,這就說明可能是代理IP無效,或者端口號錯誤,這就需要使用有效的IP才行哦。(這邊現(xiàn)在是亂填寫的IP地址)可選擇飛豬的代理IP。

Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“Python數(shù)據(jù)抓取爬蟲代理防封IP的示例分析”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI