在Python中,DataFrame是pandas庫(kù)中的一個(gè)數(shù)據(jù)結(jié)構(gòu),用于處理和分析數(shù)據(jù)集。DataFrame類似于Excel中的表格,可以存儲(chǔ)和操作帶有行索引和列標(biāo)簽的二維數(shù)據(jù)。
以下是一些DataFrame在Python中的常見(jiàn)用法:
創(chuàng)建DataFrame:
df = pd.DataFrame(data)
df = pd.DataFrame(data)
查看、修改和操作DataFrame:
df.head()
df.tail()
df.columns
df.index
df['column_name']
df['column_name'] = new_values
df['new_column'] = values
df.drop('column_name', axis=1)
df[df['column_name'] > 10]
聚合和統(tǒng)計(jì):
df['column_name'].mean()
df['column_name'].sum()
df['column_name'].max()
df['column_name'].min()
df['column_name'].std()
數(shù)據(jù)處理和清洗:
df.fillna(value)
df.dropna()
df.drop_duplicates()
df.replace(to_replace, value)
這些只是DataFrame的一部分常見(jiàn)用法,還有許多其他功能和方法可供使用。根據(jù)具體的數(shù)據(jù)分析需求,可以使用DataFrame進(jìn)行數(shù)據(jù)處理、清洗、分析和可視化等操作。