在Pandas中處理HTML數(shù)據(jù),可以使用pd.read_html()
函數(shù)來將HTML表格數(shù)據(jù)讀取為DataFrame對象。這個函數(shù)將返回一個包含所有表格數(shù)據(jù)的列表,每個表格數(shù)據(jù)對應(yīng)一個DataFrame對象。
以下是一個簡單的示例:
import pandas as pd
# 讀取網(wǎng)頁中的表格數(shù)據(jù)
url = 'https://en.wikipedia.org/wiki/List_of_countries_by_past_and_future_population'
tables = pd.read_html(url)
# 打印第一個表格數(shù)據(jù)
print(tables[0])
這樣就可以將網(wǎng)頁中的表格數(shù)據(jù)讀取為DataFrame對象,然后可以對數(shù)據(jù)進(jìn)行進(jìn)一步處理和分析。