BeautifulSoup怎么提取網(wǎng)頁(yè)中的所有CSS鏈接

小億
113
2024-05-14 12:50:16

要提取網(wǎng)頁(yè)中的所有CSS鏈接,首先需要使用BeautifulSoup庫(kù)解析網(wǎng)頁(yè)內(nèi)容。然后可以通過(guò)查找所有的link標(biāo)簽并篩選出具有rel="stylesheet"屬性的標(biāo)簽來(lái)獲取所有的CSS鏈接。

以下是一個(gè)示例代碼,演示如何提取網(wǎng)頁(yè)中的所有CSS鏈接:

from bs4 import BeautifulSoup
import requests

# 發(fā)起請(qǐng)求并獲取網(wǎng)頁(yè)內(nèi)容
url = 'https://www.example.com'
response = requests.get(url)
html_content = response.text

# 使用BeautifulSoup解析網(wǎng)頁(yè)內(nèi)容
soup = BeautifulSoup(html_content, 'html.parser')

# 查找所有的link標(biāo)簽
link_tags = soup.find_all('link')

# 篩選出具有rel="stylesheet"屬性的link標(biāo)簽
css_links = [link.get('href') for link in link_tags if link.get('rel') == ['stylesheet']]

# 打印所有的CSS鏈接
for css_link in css_links:
    print(css_link)

運(yùn)行以上代碼,就可以獲取網(wǎng)頁(yè)中的所有CSS鏈接并打印出來(lái)。您可以根據(jù)具體的需求對(duì)獲取到的CSS鏈接進(jìn)行后續(xù)處理。

0