溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

pandas統(tǒng)計(jì)計(jì)算和描述

發(fā)布時(shí)間:2020-10-07 08:19:31 來(lái)源:網(wǎng)絡(luò) 閱讀:232 作者:Tobey_51 欄目:大數(shù)據(jù)

Pandas統(tǒng)計(jì)計(jì)算和描述

示例代碼:

import numpy as np
import pandas as pd

df_obj = pd.DataFrame(np.random.randn(5,4), columns = ['a', 'b', 'c', 'd'])
print(df_obj)

運(yùn)行結(jié)果:

          a         b         c         d
0  1.469682  1.948965  1.373124 -0.564129
1 -1.466670 -0.494591  0.467787 -2.007771
2  1.368750  0.532142  0.487862 -1.130825
3 -0.758540 -0.479684  1.239135  1.073077
4 -0.007470  0.997034  2.669219  0.742070

常用的統(tǒng)計(jì)計(jì)算

sum, mean, max, min…

axis=0 按列統(tǒng)計(jì),axis=1按行統(tǒng)計(jì)

skipna 排除缺失值, 默認(rèn)為T(mén)rue

示例代碼:

df_obj.sum()

df_obj.max()

df_obj.min(axis=1, skipna=False)

運(yùn)行結(jié)果:

a    0.605751
b    2.503866
c    6.237127
d   -1.887578
dtype: float64

a    1.469682
b    1.948965
c    2.669219
d    1.073077
dtype: float64

0   -0.564129
1   -2.007771
2   -1.130825
3   -0.758540
4   -0.007470
dtype: float64

常用的統(tǒng)計(jì)描述

describe 產(chǎn)生多個(gè)統(tǒng)計(jì)數(shù)據(jù)

示例代碼:

print(df_obj.describe())

運(yùn)行結(jié)果:

              a         b         c         d
count  5.000000  5.000000  5.000000  5.000000
mean   0.180305  0.106488  0.244978  0.178046
std    0.641945  0.454340  1.064356  1.144416
min   -0.677175 -0.490278 -1.164928 -1.574556
25%   -0.064069 -0.182920 -0.464013 -0.089962
50%    0.231722  0.127846  0.355859  0.190482
75%    0.318854  0.463377  1.169750  0.983663
max    1.092195  0.614413  1.328220  1.380601

常用的統(tǒng)計(jì)描述方法:

  • count 非NA值的數(shù)量
  • describe 針對(duì)Series或各DataFrame列計(jì)算匯總統(tǒng)計(jì)
  • min、max 最大最小值
  • argmin、argmax 最小/最大值 索引位置
  • idxmin、idxmax 最小/最大值的索引值
  • quantile 計(jì)算樣本的分位數(shù)(0到1)
  • sum 總和
  • mean 平均數(shù)
  • median 中位數(shù)(50%分位數(shù))
  • mad 根據(jù)平均值計(jì)算平均絕對(duì)離差
  • var 樣本值的方差
  • std 樣本值的標(biāo)準(zhǔn)差
  • skew 樣本值的偏度(三階矩)
  • kurt 樣本值的峰度(四階矩)
  • cumsum 樣本值的累計(jì)和
  • cummin、cummax 樣本值的累計(jì)最大值和累計(jì)最小值
  • cumprod 樣本值的累計(jì)積
  • diff 計(jì)算一階差分(對(duì)時(shí)間序列很有用)
  • pct_change 計(jì)算百分?jǐn)?shù)變化
向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI