溫馨提示×

SQL在DataFrame中的聚合函數(shù)有哪些

sql
小樊
83
2024-09-09 22:30:32
欄目: 云計算

在Python的pandas庫中,DataFrame對象支持多種SQL類似的聚合函數(shù)

  1. count(): 計算每個分組中的行數(shù)。
  2. sum(): 計算每個分組中指定列的和。
  3. mean(): 計算每個分組中指定列的平均值。
  4. median(): 計算每個分組中指定列的中位數(shù)。
  5. min(): 計算每個分組中指定列的最小值。
  6. max(): 計算每個分組中指定列的最大值。
  7. std(): 計算每個分組中指定列的標準差。
  8. var(): 計算每個分組中指定列的方差。
  9. sem(): 計算每個分組中指定列的標準誤差。
  10. first(): 返回每個分組中指定列的第一個值。
  11. last(): 返回每個分組中指定列的最后一個值。
  12. nth(): 返回每個分組中指定列的第n個值。
  13. nunique(): 計算每個分組中指定列的唯一值的數(shù)量。

這些聚合函數(shù)可以與groupby()方法結(jié)合使用,以按照一個或多個列對數(shù)據(jù)進行分組并應(yīng)用聚合操作。例如:

import pandas as pd

# 創(chuàng)建一個示例DataFrame
data = {'A': ['foo', 'bar', 'baz', 'foo', 'bar', 'baz'],
        'B': [1, 2, 3, 4, 5, 6],
        'C': [2.0, 3.0, 4.0, 5.0, 6.0, 7.0]}
df = pd.DataFrame(data)

# 使用groupby()和agg()方法對數(shù)據(jù)進行分組和聚合
grouped = df.groupby('A').agg({'B': 'sum', 'C': 'mean'})
print(grouped)

輸出結(jié)果:

     B    C
A         
bar  7  4.5
baz  9  5.5
foo  5  3.5

在這個例子中,我們首先根據(jù)列’A’對數(shù)據(jù)進行分組,然后計算每個分組中列’B’的和以及列’C’的平均值。

0