要獲取網(wǎng)頁(yè)信息,可以使用Python的requests庫(kù)來(lái)發(fā)送HTTP請(qǐng)求,然后使用BeautifulSoup庫(kù)來(lái)解析網(wǎng)頁(yè)內(nèi)容。
下面是一個(gè)簡(jiǎn)單的示例代碼:
import requests
from bs4 import BeautifulSoup
url = 'http://example.com' # 要獲取信息的網(wǎng)頁(yè)地址
# 發(fā)送GET請(qǐng)求獲取網(wǎng)頁(yè)內(nèi)容
response = requests.get(url)
# 使用BeautifulSoup解析網(wǎng)頁(yè)內(nèi)容
soup = BeautifulSoup(response.text, 'html.parser')
# 獲取網(wǎng)頁(yè)標(biāo)題
title = soup.title.string
print('網(wǎng)頁(yè)標(biāo)題:', title)
# 獲取所有的鏈接
links = soup.find_all('a')
for link in links:
print('鏈接:', link.get('href'))
# 獲取指定元素的內(nèi)容
element = soup.find('div', class_='content')
print('內(nèi)容:', element.text.strip())
需要安裝requests庫(kù)和BeautifulSoup庫(kù),可以使用pip來(lái)安裝:
pip install requests
pip install beautifulsoup4
上述代碼中,使用requests庫(kù)發(fā)送GET請(qǐng)求獲取網(wǎng)頁(yè)內(nèi)容,然后使用BeautifulSoup解析網(wǎng)頁(yè)內(nèi)容。可以根據(jù)需要使用BeautifulSoup的各種功能來(lái)提取所需的信息。