您好,登錄后才能下訂單哦!
這篇文章主要介紹了怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表的相關(guān)知識(shí),內(nèi)容詳細(xì)易懂,操作簡(jiǎn)單快捷,具有一定借鑒價(jià)值,相信大家閱讀完這篇怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表文章都會(huì)有所收獲,下面我們一起來(lái)看看吧。
首先導(dǎo)入演示的數(shù)據(jù)集。
import pandas as pd df = pd.read_csv('銷售目標(biāo).csv') df.head()
主要參數(shù):
data
:待操作的 DataFrame
values
:被聚合操作的列,可選項(xiàng)
index
:行分組鍵,作為結(jié)果 DataFrame 的行索引
columns
:列分組鍵,作為結(jié)果 DataFrame 的列索引
aggfunc
:聚合函數(shù)/函數(shù)列表,默認(rèn) numpy.mean 這里要注意如果 aggfunc 中存在函數(shù)列表,則返回的 DataFrame 中會(huì)顯示函數(shù)名稱
fill_value
:默認(rèn) None,可設(shè)定缺省值
dropna
:默認(rèn) True,如果列的所有值都是 NaN,將被刪除;False 則保留
margins
:默認(rèn) False,設(shè)置為 True 可以添加行/列的總計(jì)
margins_name
:默認(rèn)顯示 'ALL',當(dāng) margins = True
時(shí),可以設(shè)定 margins 行/列的名稱
使用pivot_table
時(shí)必須要指定index
,因?yàn)橛?jì)算時(shí)要根據(jù)index
進(jìn)行聚合。
pd.pivot_table(df.head(20), index='訂單日期', aggfunc=np.sum)
通過(guò)指定value
來(lái)選擇被聚合的列。
pd.pivot_table(df.head(20), values='銷售目標(biāo)', index='訂單日期', aggfunc=np.sum)
當(dāng)只指定index
進(jìn)行聚合時(shí),其實(shí)用groupby
可以實(shí)現(xiàn)同樣的效果。
df.head(20).groupby(['訂單日期'])['銷售目標(biāo)'].sum().reset_index()
添加columns
參數(shù),對(duì)列分組。
pd.pivot_table(df.head(10), values='銷售目標(biāo)', index=['訂單日期', '類別'], columns='細(xì)分', aggfunc=np.sum)
對(duì)于上面結(jié)果中的空值,使用fill_value
參數(shù)統(tǒng)一填充為0
pd.pivot_table(df.head(10), values='銷售目標(biāo)', index=['訂單日期', '類別'], columns=['細(xì)分'], aggfunc=np.sum, fill_value=0)
現(xiàn)在按年份來(lái)統(tǒng)計(jì)銷售數(shù)據(jù),注意此時(shí)的aggfunc
參數(shù),當(dāng)參數(shù)值包含列表時(shí),在結(jié)果DataFrame
中就會(huì)顯示函數(shù)名稱。
pd.pivot_table(df, values='銷售目標(biāo)', index=['年份', '類別'], columns='細(xì)分', aggfunc=[np.sum])
如果需要添加合計(jì)列,只需指定margins=True
即可,同時(shí)根據(jù)需要指定合計(jì)名稱。
pd.pivot_table(df, values='銷售目標(biāo)', index=['年份', '類別'], columns='細(xì)分', aggfunc=np.sum, margins=True, margins_name='合計(jì)')
當(dāng)然與groupby
類似,對(duì)于計(jì)算函數(shù)我們可以同時(shí)指定多種方式。
pd.pivot_table(df, values='銷售目標(biāo)', index=['年份', '類別'], columns=['細(xì)分'], aggfunc={'銷售目標(biāo)': [max, np.sum]}, fill_value=0)
關(guān)于“怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表”這篇文章的內(nèi)容就介紹到這里,感謝各位的閱讀!相信大家對(duì)“怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表”知識(shí)都有一定的了解,大家如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。