溫馨提示×

python如何爬取網(wǎng)頁圖片

小億
117
2023-08-19 23:45:04
欄目: 編程語言

要使用Python爬取網(wǎng)頁圖片,可以使用requests庫來發(fā)送HTTP請求,然后使用beautifulsoup庫或者正則表達(dá)式來解析網(wǎng)頁內(nèi)容,最后使用urllib庫來下載圖片。

下面是一個簡單的示例代碼,可以爬取指定網(wǎng)頁的所有圖片并保存到本地:

import requests
from bs4 import BeautifulSoup
import urllib
# 發(fā)送HTTP請求
response = requests.get('http://example.com')
# 使用BeautifulSoup解析網(wǎng)頁內(nèi)容
soup = BeautifulSoup(response.text, 'html.parser')
# 找到所有的圖片標(biāo)簽
img_tags = soup.find_all('img')
# 下載圖片
for img_tag in img_tags:
# 獲取圖片URL
img_url = img_tag['src']
# 下載圖片并保存到本地
urllib.request.urlretrieve(img_url, 'image.jpg')

需要注意的是,上述代碼只能下載網(wǎng)頁中第一個圖片,并且沒有對錯誤進行處理。在實際應(yīng)用中,可能需要處理多張圖片和異常情況,例如使用循環(huán)來下載所有圖片,添加異常處理等。

此外,還可以使用第三方庫如Scrapy來更方便地實現(xiàn)圖片爬取功能。

0