<rt id="uxcrh"></rt><mark id="uxcrh"></mark>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

用python爬蟲在知乎上提取圖片的示例

發(fā)布時(shí)間：2020-11-23 09:59:46 來源：億速云閱讀：162 作者：小新欄目：編程語言

這篇文章主要介紹用python爬蟲在知乎上提取圖片的示例，文中介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們一定要看完！

下面的代碼注釋請仔細(xì)閱讀，中間有一個(gè)小BUG，需要手動(dòng)把pic3修改為pic2這個(gè)地方目前原因不明確，可能是我本地網(wǎng)絡(luò)的原因，還有請?jiān)陧?xiàng)目根目錄先創(chuàng)建一個(gè) imgs 的文件夾，用來存儲(chǔ)圖片

def download_img(self,data):
        ## 下載圖片
        for item in data["data"]:
            content = item["content"]
            pattern = re.compile('<noscript>(.*?)</noscript>')
            imgs = pattern.findall(content)
            if len(imgs) > 0:
                for img in imgs:
                    match = re.search('<img src="(.*?)"', img)
                    download = match.groups()[0]
                    download = download.replace("pic3", "pic2")  # 小BUG,pic3的下載不到
                    print("正在下載{}".format(download), end="")
                    try:
                        with requests.Session() as s:
                            with s.get(download) as img_down:
                                # 獲取文件名稱
                                file = download[download.rindex("/") + 1:]
                                content = img_down.content
                                with open("imgs/{}".format(file), "wb+") as f:  # 這個(gè)地方進(jìn)行了硬編碼
                                    f.write(content)
                                print("圖片下載完成", end="\n")
                    except Exception as e:
                        print(e.args)
            else:
                Pass

運(yùn)行結(jié)果為

用python爬蟲在知乎上提取圖片的示例

以上是用python爬蟲在知乎上提取圖片的示例的所有內(nèi)容，感謝各位的閱讀！希望分享的內(nèi)容對大家有幫助，更多相關(guān)知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
python爬蟲采集知乎后怎么輸出內(nèi)容
下一篇新聞：
scrapy在python爬蟲中抓取符號(hào)出錯(cuò)的解決方法

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

<mark id="yaljn"></mark>
<th id="yaljn"></th>

<mark id="yaljn"></mark>

<big id="yaljn"></big>