python爬蟲(chóng)中如何使用header

發(fā)布時(shí)間：2020-11-24 09:50:20 來(lái)源：億速云閱讀：649 作者：小新欄目：編程語(yǔ)言

這篇文章主要介紹python爬蟲(chóng)中如何使用header，文中介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們一定要看完！

headers是解決requests請(qǐng)求反爬的方法之一，相當(dāng)于我們進(jìn)去這個(gè)網(wǎng)頁(yè)的服務(wù)器本身，假裝自己本身在爬取數(shù)據(jù)。

對(duì)反爬蟲(chóng)網(wǎng)頁(yè)，可以設(shè)置一些headers信息，模擬成瀏覽器取訪問(wèn)網(wǎng)站。

谷歌或者火狐瀏覽器，在網(wǎng)頁(yè)面上點(diǎn)擊：右鍵–檢查；點(diǎn)擊更多工具-開(kāi)發(fā)者工具；直接F12亦可。然后再按Fn+F5刷新出網(wǎng)頁(yè)來(lái)顯示元素

有的瀏覽器是點(diǎn)擊：右鍵->查看元素，刷新

python爬蟲(chóng)中如何使用header

注意：headers中有很多內(nèi)容，主要常用的就是user-agent 和 host，他們是以鍵對(duì)的形式展現(xiàn)出來(lái)，如果user-agent 以字典鍵對(duì)形式作為headers的內(nèi)容，就可以反爬成功，就不需要其他鍵對(duì)；否則，需要加入headers下的更多鍵對(duì)形式。

import urllib2
import urllib
values={"username":"xxxx","password":"xxxxx"}
data=urllib.urlencode(values)
url= "https://ssl.gstatic.com/gb/images/v2_730ffe61.png"
user_agent="Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1"
referer='http://www.google.com/'
headers={"User-Agent":user_agent,'Referer':referer}
request=urllib2.Request(url,data,headers)
response=urllib2.urlopen(request)
print response.read()

以上是“python爬蟲(chóng)中如何使用header”這篇文章的所有內(nèi)容，感謝各位的閱讀！希望分享的內(nèi)容對(duì)大家有幫助，更多相關(guān)知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問(wèn)一下細(xì)節(jié)

python爬蟲(chóng)中如何使用header

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽