溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python爬蟲爬取商品失敗怎么辦

發(fā)布時間:2021-08-05 09:11:10 來源:億速云 閱讀:159 作者:小新 欄目:編程語言

這篇文章主要介紹Python爬蟲爬取商品失敗怎么辦,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!

1.登陸網站,開啟開發(fā)者模式。

可以在瀏覽器中點擊右鍵檢查或者F12打開開發(fā)者模式。

2.點選 NetWork,DOC,然后刷新頁面。

在 network 中選擇 doc,在請求的 headers 中搜索 cookie。

3.獲取對應的 cookie 以及 user-agent。

4.在代碼中添加到 headers 里面。

def getHTMLText(url):
  kv = {
    'cookie': 'adsgadfafegadsgadsfaefasdfaewfadsfag'
    'uaer-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'
  }
    try:
    r = requests.get(url, headers=kv, timeout=30)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    return r.text
  except:
    return "gg"

當然如果出現(xiàn)ip高頻率訪問限制的問題,還是需要通過更換ip來解決

以上是“Python爬蟲爬取商品失敗怎么辦”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業(yè)資訊頻道!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。

AI