溫馨提示×

python怎么抓取網(wǎng)頁內(nèi)容并保存

小億
169
2023-10-16 14:52:32
欄目: 編程語言

要抓取網(wǎng)頁內(nèi)容并保存,可以使用Python的requests庫和文件操作功能。

首先,安裝requests庫,可以使用以下命令:

pip install requests

然后,使用下面的代碼來抓取網(wǎng)頁內(nèi)容并保存:

import requests
# 發(fā)起請求
url = "http://example.com"
response = requests.get(url)
# 檢查響應(yīng)狀態(tài)碼
if response.status_code == 200:
# 保存網(wǎng)頁內(nèi)容到文件
with open("page.html", "w", encoding="utf-8") as file:
file.write(response.text)
print("網(wǎng)頁內(nèi)容保存成功!")
else:
print("網(wǎng)頁請求失敗,狀態(tài)碼:", response.status_code)

以上代碼中,我們首先使用requests庫的get方法發(fā)起一個GET請求,獲取到網(wǎng)頁的響應(yīng)。然后,我們檢查響應(yīng)的狀態(tài)碼,如果是200,表示請求成功。最后,我們使用Python的文件操作功能,將網(wǎng)頁內(nèi)容保存到名為page.html的文件中。

請注意,上述代碼中的url和文件名可以根據(jù)實(shí)際情況進(jìn)行修改。另外,要確保你有足夠的權(quán)限來創(chuàng)建和寫入文件。

0