要抓取網(wǎng)頁內(nèi)容,可以使用Python中的requests庫。下面是一個(gè)簡單的示例代碼:
import requests
# 發(fā)起GET請求獲取網(wǎng)頁內(nèi)容
url = 'https://www.example.com'
response = requests.get(url)
# 檢查請求是否成功
if response.status_code == 200:
# 輸出網(wǎng)頁內(nèi)容
print(response.text)
else:
print('請求失敗')
這段代碼使用requests庫的get方法發(fā)起了一個(gè)GET請求,返回的response對象包含了網(wǎng)頁的內(nèi)容??梢酝ㄟ^response.text
屬性獲取網(wǎng)頁的文本內(nèi)容。
如果需要傳遞參數(shù)或者Headers,可以在get方法中傳遞對應(yīng)的參數(shù)。例如:
import requests
url = 'https://www.example.com'
params = {'key1': 'value1', 'key2': 'value2'}
headers = {'User-Agent': 'Mozilla/5.0'}
response = requests.get(url, params=params, headers=headers)
這里通過params參數(shù)傳遞了查詢參數(shù),通過headers參數(shù)傳遞了請求頭信息。
除了requests庫,還可以使用其他第三方庫(如BeautifulSoup、Scrapy等)來進(jìn)一步處理網(wǎng)頁內(nèi)容,提取需要的數(shù)據(jù)。