您好,登錄后才能下訂單哦!
這篇文章主要介紹了pd.DataFrame如何統(tǒng)計(jì)各列數(shù)值是多少,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
如下所示:
.count() #非空元素計(jì)算 .min() a #最小值 .max() #最大值 .idxmin() #最小值的位置,類(lèi)似于R中的which.min函數(shù) .idxmax() #最大值的位置,類(lèi)似于R中的which.max函數(shù) .quantile(0.75) #75%分位數(shù) .sum() #求和 .mean() #均值 .median() #中位數(shù) .mode() #眾數(shù) .var() #方差 .std() #標(biāo)準(zhǔn)差 .mad() #平均絕對(duì)偏差 .skew() #偏度 .kurt() #峰度 .describe() #一次性輸出多個(gè)描述性統(tǒng)計(jì)指標(biāo)
如果你想統(tǒng)計(jì)各個(gè)列大于0的元素個(gè)數(shù):
data[data>0].count()
會(huì)出現(xiàn)各個(gè)屬性(列)大于零的個(gè)數(shù)
data[data['A']>0].count()
列A大于0的個(gè)數(shù)
這里說(shuō)明,data的數(shù)據(jù)格式必須是DataFrame
pd.Series().value_counts(),會(huì)統(tǒng)計(jì)各個(gè)類(lèi)的統(tǒng)計(jì)值。
我們?cè)谟眠@些函數(shù)時(shí),會(huì)迷茫,不知道什么時(shí)候value_counts(),什么時(shí)候count()
這和前面的數(shù)據(jù)形式是有關(guān)的,只要前面是Series數(shù)據(jù),要用value_counts(),前面數(shù)據(jù)形式是DataFrame要用count()
感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“pd.DataFrame如何統(tǒng)計(jì)各列數(shù)值是多少”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。