怎么用python抓取網(wǎng)頁內(nèi)容并保存

小億
136
2023-12-05 02:57:26
欄目: 編程語言

要使用Python抓取網(wǎng)頁內(nèi)容并保存,可以使用requests庫來發(fā)送HTTP請(qǐng)求獲取網(wǎng)頁內(nèi)容,然后使用open()函數(shù)將內(nèi)容保存到本地文件。

下面是一個(gè)簡單的示例代碼,可以用來抓取網(wǎng)頁內(nèi)容并保存到文件中:

import requests

url = "https://example.com"  # 要抓取的網(wǎng)頁地址

# 發(fā)送GET請(qǐng)求獲取網(wǎng)頁內(nèi)容
response = requests.get(url)
content = response.text

# 將內(nèi)容保存到文件
with open("output.html", "w", encoding="utf-8") as file:
    file.write(content)

print("內(nèi)容已保存到output.html文件中。")

在上面的代碼中,首先使用requests.get()函數(shù)發(fā)送GET請(qǐng)求獲取網(wǎng)頁內(nèi)容,然后使用response.text獲取內(nèi)容的文本形式。接著,使用open()函數(shù)以寫入模式打開一個(gè)文件,并將內(nèi)容寫入文件中。最后,通過print()函數(shù)輸出保存成功的提示信息。

請(qǐng)注意,上述代碼中的文件名是"output.html",你可以根據(jù)需要修改為自己想要保存的文件名。另外,還可以根據(jù)實(shí)際需要對(duì)獲取的內(nèi)容進(jìn)行解析和處理。

0