溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

pandas計(jì)數(shù) value_counts()的使用

發(fā)布時(shí)間:2020-08-20 11:56:08 來源:腳本之家 閱讀:167 作者:做夢當(dāng)財(cái)神 欄目:開發(fā)技術(shù)

在pandas里面常用value_counts確認(rèn)數(shù)據(jù)出現(xiàn)的頻率。

1. Series 情況下:

pandas 的 value_counts() 函數(shù)可以對(duì)Series里面的每個(gè)值進(jìn)行計(jì)數(shù)并且排序。

import pandas as pd
df = pd.DataFrame({'區(qū)域' : ['西安', '太原', '西安', '太原', '鄭州', '太原'], 
         '10月份銷售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'],
         '9月份銷售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']})
print(df)

統(tǒng)計(jì)每個(gè)區(qū)域出現(xiàn)多少次:

print(df['區(qū)域'].value_counts())

pandas計(jì)數(shù) value_counts()的使用

每個(gè)區(qū)域都被計(jì)數(shù),并且默認(rèn)從高到低排序。

如果想升序排列,設(shè)置參數(shù) ascending = True:

print(df['區(qū)域'].value_counts(ascending=True))

pandas計(jì)數(shù) value_counts()的使用

如果想得出計(jì)數(shù)占比,可以加參數(shù) normalize=True

print(df['區(qū)域'].value_counts(normalize=True))

pandas計(jì)數(shù) value_counts()的使用

注:空值默認(rèn)剔除掉的。value_counts()返回的結(jié)果是一個(gè)Series數(shù)組,可以跟別的數(shù)組進(jìn)行計(jì)算。

2. DataFrame 情況下:

import pandas as pd
df = pd.DataFrame({'區(qū)域1' : ['西安', '太原', '西安', '太原', '鄭州', '太原'],
          '區(qū)域2' : ['太原', '太原', '西安', '西安', '西安', '太原']})
print(df.apply(pd.value_counts))

pandas計(jì)數(shù) value_counts()的使用

區(qū)域2中沒有鄭州,所以是NaN。

以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI