您好,登錄后才能下訂單哦!
小編給大家分享一下pandas中有哪些不常用的函數(shù)功能,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
pandas 是我們常用的一個(gè)Python數(shù)據(jù)分析庫(kù)。其中有不少操作是我們平時(shí)很少用到的。如下:
數(shù)據(jù)源:
df
獲取某列的最小值:
df["數(shù)量"].min()
獲取最小值所對(duì)應(yīng)的汽車(chē)品牌:
df[df["數(shù)量"] == df["數(shù)量"].min()]["品牌"].values[0]
獲取最大值同理。
然而,我們可以使用.idxmax() 或 idxmin() 函數(shù)來(lái)更優(yōu)雅得實(shí)現(xiàn)以上功能:
df.loc[df["數(shù)量"].idxmin()]["品牌"]
可見(jiàn),所得結(jié)果一致,并且語(yǔ)句顯得更加簡(jiǎn)短優(yōu)雅。
用 .cut() 函數(shù)將數(shù)據(jù)區(qū)間 [10,80] 均等地分成10份,等差為 (80 - 10) / 10 = 7.
pd.cut(df["數(shù)量"],10)
查看當(dāng)前數(shù)據(jù)所屬的劃分區(qū)間:
pd.cut(df["數(shù)量"],10,labels = False)
比如獲取數(shù)量最小的前3條記錄:
df[["國(guó)家", "品牌", "數(shù)量"]].nsmallest(3, "數(shù)量")
再跟常用的方法對(duì)比一下,如下:
df.sort_values(by = "數(shù)量",ascending = True).head(3)
注意事項(xiàng):.nsmallest() 或 .nlargest() 參數(shù)里的篩選條件一定要包好在所抽取出來(lái)的DataFrame里面。
4.1 普通的篩選求和:
df[(df["國(guó)家"] == "中國(guó)") & (df["品牌"] == "五菱")]["數(shù)量"].sum()
4.2 pivot_table
pd.pivot_table(df, values = "數(shù)量", index = "品牌", columns = "國(guó)家", aggfunc = "sum").fillna(0)
4.2 pivot_table + unstack
pd.pivot_table(df, values = "數(shù)量", index = "品牌", columns = "國(guó)家", aggfunc = "sum").fillna(0).unstack()
以上是“pandas中有哪些不常用的函數(shù)功能”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。