溫馨提示×

Pandas中的cut函數如何使用

小億
88
2024-05-11 18:11:53
欄目: 編程語言

Pandas中的cut函數用于將連續(xù)的數據劃分為離散的間隔。其語法如下:

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False, duplicates='raise')

參數說明:

  • x:待劃分的數據
  • bins:用于劃分數據的間隔
  • right:是否包含右邊界,默認為True
  • labels:給每個間隔添加標簽
  • retbins:是否返回劃分的間隔
  • precision:精度
  • include_lowest:是否包含最小值
  • duplicates:處理重復的邊界值的方式

示例:

import pandas as pd

data = [1, 5, 10, 15, 20, 25]
bins = [0, 10, 20, 30]

result = pd.cut(data, bins)

print(result)

輸出:

[(0, 10], (0, 10], (0, 10], (10, 20], (10, 20], (20, 30]]
Categories (3, interval[int64]): [(0, 10] < (10, 20] < (20, 30]]

在上面的示例中,我們將數據data劃分為3個間隔,分別為(0, 10],(10, 20],(20, 30]。cut函數返回一個Categorical對象,顯示了每個值所屬的間隔。

0