溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python怎么抓取必應(yīng)搜索背景圖片

發(fā)布時(shí)間:2021-11-23 13:54:10 來源:億速云 閱讀:178 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要講解了“Python怎么抓取必應(yīng)搜索背景圖片”,文中的講解內(nèi)容簡(jiǎn)單清晰,易于學(xué)習(xí)與理解,下面請(qǐng)大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“Python怎么抓取必應(yīng)搜索背景圖片”吧!

首先,我們安裝IDE,這里我選擇Python最流行的PyCharm,大家可以到官網(wǎng)上下載:

https://www.jetbrains.com/pycharm/download/#section=windows

安裝方法非常簡(jiǎn)單,直接下一步就行。

安裝完成后,打開IDE,我們創(chuàng)建一個(gè)Python的項(xiàng)目

完成后,還要事先安裝幾個(gè)庫(kù),方便我們后面寫代碼使用,分別是:

request

BeautifulSoup4

lxml

安裝方法很簡(jiǎn)單,我們點(diǎn)擊編譯器左上角的File->Settings彈出對(duì)話框:

Python怎么抓取必應(yīng)搜索背景圖片

我們雙擊上圖中的pip,在彈出的對(duì)話框里面分別搜索上面羅列的三個(gè)庫(kù)名字,然后點(diǎn)擊左下角的InstallPackage即可完成安裝:

Python怎么抓取必應(yīng)搜索背景圖片

完成以后,我們開始寫代碼:

首先我們引入四個(gè)我們需要的包代碼:

if __name__=='__main__':
    for i in range(8):
        url = 'https://cn.bing.com/HPImageArchive.aspx?idx={}&n=1'.format(i)
        html = get_page(url)
        soup = BeautifulSoup(html, 'lxml')
        text = soup.find(name='url').string
        img_url = 'https://cn.bing.com' + text
        img_name = re.match('^/th\?id=(.*?)&', text).group(1)
        download(img_url, '填你自己想保存的文件路徑c:/..', img_name)

然后我們定義一個(gè)get_page的函數(shù)來獲取request請(qǐng)求得到的網(wǎng)頁(yè)內(nèi)容,不過為了偽裝成瀏覽器訪問,我們這里要更改一下User-Agent字段:

def get_page(url):
    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'
    }
    response = requests.get(url, headers=headers)
      if response.status_code == 200:     #響應(yīng)狀態(tài)碼表示服務(wù)器對(duì)請(qǐng)求的響應(yīng)結(jié)果。200代表服務(wù)器響應(yīng)成功,403代表禁止訪問,404代表頁(yè)面未找到
            return response.text

再來定義一個(gè)下載圖片的函數(shù)download,傳入的參數(shù)包含圖片的url路徑,你自己定義的文件夾路徑還有圖片的名稱:

def download(url, path, fname):
    response = requests.get(url)
    if response:
        with open(os.path.join(path, fname), 'wb') as f:
            f.write(response.content)
            print('successful: {} .'.format(fname))
    else:
        print('faild: {}.'.format(fname))

好了,上面兩個(gè)主要的函數(shù)定義好了以后,我們?cè)俣xmain函數(shù),來不斷調(diào)用他們,注意download函數(shù)的路徑要填寫你自己的文件夾路徑。由于必應(yīng)官方只保存了八張?jiān)瓐D,所以我們就簡(jiǎn)單粗暴地只循環(huán)8次即可,代碼如下:

if __name__=='__main__':
    for i in range(8):
        url = 'https://cn.bing.com/HPImageArchive.aspx?idx={}&n=1'.format(i)
        html = get_page(url)
        soup = BeautifulSoup(html, 'lxml')
        text = soup.find(name='url').string
        img_url = 'https://cn.bing.com' + text
        img_name = re.match('^/th\?id=(.*?)&', text).group(1)
        download(img_url, '填你自己想保存的文件路徑c:/..', img_name)

好了,上面就是完整的代碼內(nèi)容,我們?cè)囍\(yùn)行一次

結(jié)果完全沒問題,看文件夾里面的圖片也保存下來了:

Python怎么抓取必應(yīng)搜索背景圖片

感謝各位的閱讀,以上就是“Python怎么抓取必應(yīng)搜索背景圖片”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對(duì)Python怎么抓取必應(yīng)搜索背景圖片這一問題有了更深刻的體會(huì),具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識(shí)點(diǎn)的文章,歡迎關(guān)注!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI