python爬取網(wǎng)站數(shù)據(jù)，如何繞過反爬蟲策略

發(fā)布時(shí)間：2020-07-10 13:40:27 來源：網(wǎng)絡(luò) 閱讀：959 作者：156881887 欄目：編程語言

1、使用session對(duì)象

session = requests.session()
strhtml = session.get(url) #與當(dāng)前網(wǎng)站的首次會(huì)話

2、設(shè)置headers

headers = {"User-Agent": "Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                         "Chrome/69.0.3497.100 Safari/537.36",
           "Accept": "application/json"}
session.headers = headers

3、設(shè)置cookies

設(shè)置與網(wǎng)站首次會(huì)話時(shí)的cookies為默認(rèn)的cookies

cookies = session.cookies
session.headers.setdefault('cookies', cookies)

此后，可以復(fù)用之前會(huì)話中的cookies了

strhtml2 = session.get(url2)

向AI問一下細(xì)節(jié)

python爬取網(wǎng)站數(shù)據(jù)，如何繞過反爬蟲策略

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

python爬取網(wǎng)站數(shù)據(jù)，如何繞過反爬蟲策略