溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

發(fā)布時(shí)間:2022-06-17 09:43:40 來(lái)源:億速云 閱讀:183 作者:iii 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要介紹了怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表的相關(guān)知識(shí),內(nèi)容詳細(xì)易懂,操作簡(jiǎn)單快捷,具有一定借鑒價(jià)值,相信大家閱讀完這篇怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表文章都會(huì)有所收獲,下面我們一起來(lái)看看吧。

導(dǎo)入示例數(shù)據(jù)

首先導(dǎo)入演示的數(shù)據(jù)集。

import pandas as pd

df = pd.read_csv('銷售目標(biāo).csv')
df.head()

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

參數(shù)說(shuō)明

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

主要參數(shù):

  • data:待操作的 DataFrame

  • values:被聚合操作的列,可選項(xiàng)

  • index:行分組鍵,作為結(jié)果 DataFrame 的行索引

  • columns:列分組鍵,作為結(jié)果 DataFrame 的列索引

  • aggfunc:聚合函數(shù)/函數(shù)列表,默認(rèn) numpy.mean 這里要注意如果 aggfunc 中存在函數(shù)列表,則返回的 DataFrame 中會(huì)顯示函數(shù)名稱

  • fill_value:默認(rèn) None,可設(shè)定缺省值

  • dropna:默認(rèn) True,如果列的所有值都是 NaN,將被刪除;False 則保留

  • margins:默認(rèn) False,設(shè)置為 True 可以添加行/列的總計(jì)

  • margins_name:默認(rèn)顯示 'ALL',當(dāng) margins = True 時(shí),可以設(shè)定 margins  行/列的名稱

常用操作

使用pivot_table時(shí)必須要指定index,因?yàn)橛?jì)算時(shí)要根據(jù)index進(jìn)行聚合。

pd.pivot_table(df.head(20),
               index='訂單日期',
               aggfunc=np.sum)

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

通過(guò)指定value來(lái)選擇被聚合的列。

pd.pivot_table(df.head(20),
               values='銷售目標(biāo)',
               index='訂單日期',
               aggfunc=np.sum)

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

當(dāng)只指定index進(jìn)行聚合時(shí),其實(shí)用groupby可以實(shí)現(xiàn)同樣的效果。

df.head(20).groupby(['訂單日期'])['銷售目標(biāo)'].sum().reset_index()

添加columns參數(shù),對(duì)列分組。

pd.pivot_table(df.head(10),
               values='銷售目標(biāo)',
               index=['訂單日期', '類別'],
               columns='細(xì)分',
               aggfunc=np.sum)

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

對(duì)于上面結(jié)果中的空值,使用fill_value參數(shù)統(tǒng)一填充為0

pd.pivot_table(df.head(10),
               values='銷售目標(biāo)',
               index=['訂單日期', '類別'],
               columns=['細(xì)分'],
               aggfunc=np.sum,
               fill_value=0)

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

現(xiàn)在按年份來(lái)統(tǒng)計(jì)銷售數(shù)據(jù),注意此時(shí)的aggfunc參數(shù),當(dāng)參數(shù)值包含列表時(shí),在結(jié)果DataFrame中就會(huì)顯示函數(shù)名稱。

pd.pivot_table(df,
               values='銷售目標(biāo)',
               index=['年份', '類別'],
               columns='細(xì)分',
               aggfunc=[np.sum])

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

如果需要添加合計(jì)列,只需指定margins=True即可,同時(shí)根據(jù)需要指定合計(jì)名稱。

pd.pivot_table(df,
               values='銷售目標(biāo)',
               index=['年份', '類別'],
               columns='細(xì)分',
               aggfunc=np.sum,
               margins=True,
              margins_name='合計(jì)')

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

當(dāng)然與groupby類似,對(duì)于計(jì)算函數(shù)我們可以同時(shí)指定多種方式。

pd.pivot_table(df,
               values='銷售目標(biāo)',
               index=['年份', '類別'],
               columns=['細(xì)分'],
               aggfunc={'銷售目標(biāo)': [max, np.sum]},
               fill_value=0)

怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表

關(guān)于“怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表”這篇文章的內(nèi)容就介紹到這里,感謝各位的閱讀!相信大家對(duì)“怎么使用Python+Pandas實(shí)現(xiàn)數(shù)據(jù)透視表”知識(shí)都有一定的了解,大家如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI