溫馨提示×

Pandas中怎么處理HTML數(shù)據(jù)

小億
119
2024-05-11 17:06:49
欄目: 編程語言

在Pandas中處理HTML數(shù)據(jù),可以使用pd.read_html()函數(shù)來將HTML表格數(shù)據(jù)讀取為DataFrame對象。這個函數(shù)將返回一個包含所有表格數(shù)據(jù)的列表,每個表格數(shù)據(jù)對應(yīng)一個DataFrame對象。

以下是一個簡單的示例:

import pandas as pd

# 讀取網(wǎng)頁中的表格數(shù)據(jù)
url = 'https://en.wikipedia.org/wiki/List_of_countries_by_past_and_future_population'
tables = pd.read_html(url)

# 打印第一個表格數(shù)據(jù)
print(tables[0])

這樣就可以將網(wǎng)頁中的表格數(shù)據(jù)讀取為DataFrame對象,然后可以對數(shù)據(jù)進(jìn)行進(jìn)一步處理和分析。

0