<li id="3qlaq"></li>

<tbody id="3qlaq"><p id="3qlaq"></p></tbody>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

使用Python怎么爬取網(wǎng)站圖片并保存

發(fā)布時間：2021-02-26 16:54:39 來源：億速云閱讀：210 作者：Leah 欄目：開發(fā)技術(shù)

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)使用Python怎么爬取網(wǎng)站圖片并保存，文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述，閱讀完這篇文章希望大家可以有所收獲。

第一步，導(dǎo)入模塊

import requests
from bs4 import BeautifulSoup

requests用來請求html頁面，BeautifulSoup用來解析html

第二步，獲取目標(biāo)html頁面

hd = {'user-agent': 'chrome/10'} # 偽裝自己是個(chrome)瀏覽器=-=

def download_all_html():
  try:
    url = 'https://www.bilibili.com/' # 將要爬取網(wǎng)站的地址
    request = requests.get(url, timeout=30, headers=hd) # 獲取改網(wǎng)站的信息
    request.raise_for_status() # 判斷狀態(tài)碼是否為200，！=200顯然爬取失敗
    request.encoding = request.apparent_encoding # 設(shè)置編碼格式
    return request.text # 返回html頁面
  except:
    return ''

第三步，分析網(wǎng)站html構(gòu)造

1、顯示網(wǎng)站html代碼

使用Python怎么爬取網(wǎng)站圖片并保存

2、找到圖片位置

使用Python怎么爬取網(wǎng)站圖片并保存

3、分析

使用Python怎么爬取網(wǎng)站圖片并保存

使用Python怎么爬取網(wǎng)站圖片并保存

第四步，直接上代碼注釋夠詳細(xì)=-=

def parse_single_html(html):
  soup = BeautifulSoup(html, 'html.parser') # 解析html,可以單獨去了解一下他的使用
  divs = soup.find_all('div', class_='card-pic') # 獲取滿足條件的div,find_all(所有)
  for div in divs: # 瞞住條件的div有多個，我們單獨獲取
    p = div.find('p') # 有源代碼可知，每個div下都有一個p標(biāo)簽，存儲圖片的title,獲取p標(biāo)簽
    if p == None:
      continue
    title = p['title'] # 獲取p標(biāo)簽中的title屬性，用來做圖片的名稱
    img = div.find('img')['src'] # 獲取圖片的地址
    if img[0:6] != 'https:': # 根據(jù)源代碼發(fā)現(xiàn)，有的地址缺少"https:"前綴
      img = 'https:' + img # 如果缺少，我們給他添上就行啦，都據(jù)情況而定
    response = requests.get(img) # get方法得到圖片地址（有的是post、put）基本是get
    with open('./Img/{}.png'.format(title), 'wb') as f: # 創(chuàng)建用來保存圖片的.png文件
      f.write(response.content) # 注意，'wb'中的b 必不可少！！


parse_single_html(download_all_html()) # 最后調(diào)用我們寫的兩個函數(shù)就行啦，

上述就是小編為大家分享的使用Python怎么爬取網(wǎng)站圖片并保存了，如果剛好有類似的疑惑，不妨參照上述分析進行理解。如果想知道更多相關(guān)知識，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
怎么在pycharm中將Tab鍵設(shè)置成4個空格
下一篇新聞：
如何在golang項目中使用now時間處理工具箱

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼