<source id="kacko"><td id="kacko"></td></source>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Python中如何下載文件

發(fā)布時(shí)間：2021-07-10 14:29:30 來(lái)源：億速云閱讀：246 作者：Leah 欄目：大數(shù)據(jù)

Python中如何下載文件，很多新手對(duì)此不是很清楚，為了幫助大家解決這個(gè)難題，下面小編將為大家詳細(xì)講解，有這方面需求的人可以來(lái)學(xué)習(xí)下，希望你能有所收獲。

使用Requests

你可以使用requests模塊從一個(gè)URL下載文件。

考慮以下代碼:

Python中如何下載文件

你只需使用requests模塊的get方法獲取URL，并將結(jié)果存儲(chǔ)到一個(gè)名為“myfile”的變量中。然后，將這個(gè)變量的內(nèi)容寫入文件。

使用wget

你還可以使用Python的wget模塊從一個(gè)URL下載文件。你可以使用pip按以下命令安裝wget模塊:

Python中如何下載文件

考慮以下代碼，我們將使用它下載Python的logo圖像。

Python中如何下載文件

在這段代碼中，URL和路徑(圖像將存儲(chǔ)在其中)被傳遞給wget模塊的download方法。

下載重定向的文件

在本節(jié)中，你將學(xué)習(xí)如何使用requests從一個(gè)URL下載文件，該URL會(huì)被重定向到另一個(gè)帶有一個(gè).pdf文件的URL。該URL看起來(lái)如下:

Python中如何下載文件

要下載這個(gè)pdf文件，請(qǐng)使用以下代碼:

Python中如何下載文件

在這段代碼中，我們第一步指定的是URL。然后，我們使用request模塊的get方法來(lái)獲取該URL。在get方法中，我們將allow_redirects設(shè)置為True，這將允許URL中的重定向，并且重定向后的內(nèi)容將被分配給變量myfile。

最后，我們打開(kāi)一個(gè)文件來(lái)寫入獲取的內(nèi)容。

分塊下載大文件

考慮下面的代碼:

Python中如何下載文件

首先，我們像以前一樣使用requests模塊的get方法，但是這一次，我們將把stream屬性設(shè)置為True。

接著，我們?cè)诋?dāng)前工作目錄中創(chuàng)建一個(gè)名為PythonBook.pdf的文件，并打開(kāi)它進(jìn)行寫入。

然后，我們指定每次要下載的塊大小。我們已經(jīng)將其設(shè)置為1024字節(jié)，接著遍歷每個(gè)塊，并在文件中寫入這些塊，直到塊結(jié)束。

不漂亮嗎?不要擔(dān)心，稍后我們將顯示一個(gè)下載過(guò)程的進(jìn)度條。

下載多個(gè)文件(并行/批量下載)

要同時(shí)下載多個(gè)文件，請(qǐng)導(dǎo)入以下模塊:

Python中如何下載文件

我們導(dǎo)入了os和time模塊來(lái)檢查下載文件需要多少時(shí)間。ThreadPool模塊允許你使用池運(yùn)行多個(gè)線程或進(jìn)程。

讓我們創(chuàng)建一個(gè)簡(jiǎn)單的函數(shù)，將響應(yīng)分塊發(fā)送到一個(gè)文件:

Python中如何下載文件

這個(gè)URL是一個(gè)二維數(shù)組，它指定了你要下載的頁(yè)面的路徑和URL。

Python中如何下載文件

就像在前一節(jié)中所做的那樣，我們將這個(gè)URL傳遞給requests.get。最后，我們打開(kāi)文件(URL中指定的路徑)并寫入頁(yè)面內(nèi)容。

現(xiàn)在，我們可以分別為每個(gè)URL調(diào)用這個(gè)函數(shù)，我們也可以同時(shí)為所有URL調(diào)用這個(gè)函數(shù)。讓我們?cè)趂or循環(huán)中分別為每個(gè)URL調(diào)用這個(gè)函數(shù)，注意計(jì)時(shí)器:

Python中如何下載文件

現(xiàn)在，使用以下代碼行替換for循環(huán)：

Python中如何下載文件

運(yùn)行該腳本。

使用進(jìn)度條進(jìn)行下載

進(jìn)度條是clint模塊的一個(gè)UI組件。輸入以下命令來(lái)安裝clint模塊：

Python中如何下載文件

考慮以下代碼:

Python中如何下載文件

在這段代碼中，我們首先導(dǎo)入了requests模塊，然后，我們從clint.textui導(dǎo)入了進(jìn)度組件。唯一的區(qū)別是在for循環(huán)中。在將內(nèi)容寫入文件時(shí)，我們使用了進(jìn)度條模塊的bar方法。

使用urllib下載網(wǎng)頁(yè)

在本節(jié)中，我們將使用urllib下載一個(gè)網(wǎng)頁(yè)。

urllib庫(kù)是Python的標(biāo)準(zhǔn)庫(kù)，因此你不需要安裝它。

以下代碼行可以輕松地下載一個(gè)網(wǎng)頁(yè):

Python中如何下載文件

在這里指定你想將文件保存為什么以及你想將它存儲(chǔ)在哪里的URL，

Python中如何下載文件

在這段代碼中，我們使用了urlretrieve方法并傳遞了文件的URL，以及保存文件的路徑。文件擴(kuò)展名將是.html。

通過(guò)代理下載

如果你需要使用代理下載你的文件，你可以使用urllib模塊的ProxyHandler。請(qǐng)看以下代碼：

Python中如何下載文件

在這段代碼中，我們創(chuàng)建了代理對(duì)象，并通過(guò)調(diào)用urllib的build_opener方法來(lái)打開(kāi)該代理，并傳入該代理對(duì)象。然后，我們創(chuàng)建請(qǐng)求來(lái)獲取頁(yè)面。

此外，你還可以按照官方文檔的介紹來(lái)使用requests模塊:

Python中如何下載文件

你只需要導(dǎo)入requests模塊并創(chuàng)建你的代理對(duì)象。然后，你就可以獲取文件了。

使用urllib3

urllib3是urllib模塊的改進(jìn)版本。你可以使用pip下載并安裝它:

Python中如何下載文件

我們將通過(guò)使用urllib3來(lái)獲取一個(gè)網(wǎng)頁(yè)并將它存儲(chǔ)在一個(gè)文本文件中。

導(dǎo)入以下模塊:

Python中如何下載文件

在處理文件時(shí)，我們使用了shutil模塊。

現(xiàn)在，我們像這樣來(lái)初始化URL字符串變量：

Python中如何下載文件

然后，我們使用了urllib3的PoolManager ，它會(huì)跟蹤必要的連接池。

Python中如何下載文件

創(chuàng)建一個(gè)文件:

Python中如何下載文件

最后，我們發(fā)送一個(gè)GET請(qǐng)求來(lái)獲取該URL并打開(kāi)一個(gè)文件，接著將響應(yīng)寫入該文件:

Python中如何下載文件

使用Boto3從S3下載文件

要從Amazon S3下載文件，你可以使用Python boto3模塊。

在開(kāi)始之前，你需要使用pip安裝awscli模塊:

Python中如何下載文件

對(duì)于AWS配置，請(qǐng)運(yùn)行以下命令：

Python中如何下載文件

現(xiàn)在，按以下命令輸入你的詳細(xì)信息：

Python中如何下載文件

要從Amazon S3下載文件，你需要導(dǎo)入boto3和botocore。Boto3是一個(gè)Amazon SDK，它允許Python訪問(wèn)Amazon web服務(wù)(如S3)。Botocore提供了與Amazon web服務(wù)進(jìn)行交互的命令行服務(wù)。

Botocore自帶了awscli。要安裝boto3，請(qǐng)運(yùn)行以下命令:

Python中如何下載文件

現(xiàn)在，導(dǎo)入這兩個(gè)模塊：

Python中如何下載文件

在從Amazon下載文件時(shí)，我們需要三個(gè)參數(shù)：

Bucket名稱
你需要下載的文件名稱
文件下載之后的名稱

初始化變量：

Python中如何下載文件

現(xiàn)在，我們初始化一個(gè)變量來(lái)使用會(huì)話的資源。為此，我們將調(diào)用boto3的resource()方法并傳入服務(wù)，即s3:

Python中如何下載文件

最后，使用download_file方法下載文件并傳入變量:

Python中如何下載文件

使用asyncio

asyncio模塊主要用于處理系統(tǒng)事件。它圍繞一個(gè)事件循環(huán)進(jìn)行工作，該事件循環(huán)會(huì)等待事件發(fā)生，然后對(duì)該事件作出反應(yīng)。這個(gè)反應(yīng)可以是調(diào)用另一個(gè)函數(shù)。這個(gè)過(guò)程稱為事件處理。asyncio模塊使用協(xié)同程序進(jìn)行事件處理。

要使用asyncio事件處理和協(xié)同功能，我們將導(dǎo)入asyncio模塊:

Python中如何下載文件

現(xiàn)在，像這樣定義asyncio協(xié)同方法：

Python中如何下載文件

關(guān)鍵字async表示這是一個(gè)原生asyncio協(xié)同程序。在協(xié)同程序的內(nèi)部，我們有一個(gè)await關(guān)鍵字，它會(huì)返回一個(gè)特定的值。我們也可以使用return關(guān)鍵字。

現(xiàn)在，讓我們使用協(xié)同創(chuàng)建一段代碼來(lái)從網(wǎng)站下載一個(gè)文件:

Python中如何下載文件

看完上述內(nèi)容是否對(duì)您有幫助呢？如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章，請(qǐng)關(guān)注億速云行業(yè)資訊頻道，感謝您對(duì)億速云的支持。

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Python中PyG2Plot可視化庫(kù)如何使用
下一篇新聞：
python分詞工具哪個(gè)好用

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼