您好,登錄后才能下訂單哦!
本文小編為大家詳細(xì)介紹“怎么用Python爬蟲(chóng)進(jìn)行圖片自動(dòng)下載”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“怎么用Python爬蟲(chóng)進(jìn)行圖片自動(dòng)下載”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來(lái)學(xué)習(xí)新知識(shí)吧。
1.分析需求。
例如上百度搜圖,需要根據(jù)搜索功能,搜尋圖片后,選定其中一個(gè)查看源代碼,找出圖片相匹配的源代碼,假如圖片多地址,例如有thumbURL,middleURL,hoverURL,objURL,各自點(diǎn)開(kāi)看哪種圖片符合要求。要是objURL符合需求,格式為.jpg。
2.選擇python庫(kù)。
選擇2個(gè)包,一個(gè)是正則,一個(gè)是requests包。
3.編寫(xiě)代碼。
復(fù)制百度圖片搜索的鏈接,傳入requests,然后把正則表達(dá)式寫(xiě)好。
因?yàn)橛泻芏鄰垐D片,所以要循環(huán),我們打印出結(jié)果來(lái)看看,然后用requests獲取網(wǎng)址,由于有些圖片可能存在網(wǎng)址打不開(kāi)的情況,所以加了10秒超時(shí)控制。
4.圖片保存
建立好一個(gè)images目錄,把圖片都放進(jìn)去,命名的時(shí)候,以數(shù)字命名。
讀到這里,這篇“怎么用Python爬蟲(chóng)進(jìn)行圖片自動(dòng)下載”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識(shí)點(diǎn)還需要大家自己動(dòng)手實(shí)踐使用過(guò)才能領(lǐng)會(huì),如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。