<dfn id="vqyzk"><li id="vqyzk"></li></dfn>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Python3.x爬蟲下載網(wǎng)頁圖片的實例講解

發(fā)布時間：2020-10-17 17:51:30 來源：腳本之家閱讀：235 作者：hanchaobiao 欄目：開發(fā)技術(shù)

一、選取網(wǎng)址進(jìn)行爬蟲

本次我們選取pixabay圖片網(wǎng)站

url=https://pixabay.com/

Python3.x爬蟲下載網(wǎng)頁圖片的實例講解

Python3.x爬蟲下載網(wǎng)頁圖片的實例講解

二、選擇圖片右鍵選擇查看元素來尋找圖片鏈接的規(guī)則

Python3.x爬蟲下載網(wǎng)頁圖片的實例講解

Python3.x爬蟲下載網(wǎng)頁圖片的實例講解

通過查看多個圖片路徑我們發(fā)現(xiàn)取src路徑都含有 https://cdn.pixabay.com/photo/ 公共部分且圖片格式都為.jpg 因此正則表達(dá)式為

re.compile(r'^https://cdn.pixabay.com/photo/.*?jpg$')

通過以上的分析我們可以開始寫程序了

#-*- coding:utf-8 -*-
import re
import requests
import os
from bs4 import BeautifulSoup

url = 'https://pixabay.com/'
html = requests.get(url).text #獲取網(wǎng)頁內(nèi)容
print(html)
# 這里由于有些圖片可能存在網(wǎng)址打不開的情況，加個5秒超時控制。
#data-objurl="http://pic38.nipic.com/20140218/17995031_091821599000_2.jpg"獲取這種類型鏈接
soup = BeautifulSoup(html,'html.parser',from_encoding='utf-8')
#^abc.*?qwe$
pic_url = soup.find_all('img',src=re.compile(r'^https://cdn.pixabay.com/photo/.*?jpg$'))
#pic_url = pic_node.get_text()
#pic_url = re.findall('"https://cdn.pixabay.com/photo/""(.*?)",',html,re.S)
print(pic_url)
i = 0
#判斷image文件夾是否存在，不存在則創(chuàng)建
if not os.path.exists('image'):
 os.makedirs('image')
for url in pic_url:
 img = url['src']
 try:
 pic = requests.get(img,timeout=5) #超時異常判斷 5秒超時
 except requests.exceptions.ConnectionError:
 print('當(dāng)前圖片無法下載')
 continue
 file_name = "image/"+str(i)+".jpg" #拼接圖片名
 print(file_name)
 #將圖片存入本地
 fp = open(file_name,'wb')
 fp.write(pic.content) #寫入圖片
 fp.close()
 i+=1

代碼是不是很簡單呢如果你想修改地址取爬取別的網(wǎng)站請注意分析下載圖片路徑的共性并設(shè)計合理的正則表達(dá)式，否則是無法獲取到圖片路徑的

執(zhí)行過程截圖：

Python3.x爬蟲下載網(wǎng)頁圖片的實例講解

以上這篇Python3.x爬蟲下載網(wǎng)頁圖片的實例講解就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持億速云。

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
無法解決 equal to 運算中 "Chinese_PRC_CI_AS_WS" 和 "Chinese_PRC_CI_AS" 之間的排序規(guī)則沖突。
下一篇新聞：
JS仿Base.js實現(xiàn)的繼承示例

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼

<acronym id="kyqdt"></acronym>