您好,登錄后才能下訂單哦!
在pandas里面常用value_counts確認(rèn)數(shù)據(jù)出現(xiàn)的頻率。
1. Series 情況下:
pandas 的 value_counts() 函數(shù)可以對(duì)Series里面的每個(gè)值進(jìn)行計(jì)數(shù)并且排序。
import pandas as pd df = pd.DataFrame({'區(qū)域' : ['西安', '太原', '西安', '太原', '鄭州', '太原'], '10月份銷售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'], '9月份銷售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']}) print(df)
統(tǒng)計(jì)每個(gè)區(qū)域出現(xiàn)多少次:
print(df['區(qū)域'].value_counts())
每個(gè)區(qū)域都被計(jì)數(shù),并且默認(rèn)從高到低排序。
如果想升序排列,設(shè)置參數(shù) ascending = True:
print(df['區(qū)域'].value_counts(ascending=True))
如果想得出計(jì)數(shù)占比,可以加參數(shù) normalize=True
print(df['區(qū)域'].value_counts(normalize=True))
注:空值默認(rèn)剔除掉的。value_counts()返回的結(jié)果是一個(gè)Series數(shù)組,可以跟別的數(shù)組進(jìn)行計(jì)算。
2. DataFrame 情況下:
import pandas as pd df = pd.DataFrame({'區(qū)域1' : ['西安', '太原', '西安', '太原', '鄭州', '太原'], '區(qū)域2' : ['太原', '太原', '西安', '西安', '西安', '太原']}) print(df.apply(pd.value_counts))
區(qū)域2中沒有鄭州,所以是NaN。
以上就是本文的全部內(nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。