溫馨提示×

Pandas中怎么進行數據離散化

小億
101
2024-05-11 16:52:50
欄目: 編程語言

Pandas中可以使用cut函數進行數據離散化,將連續(xù)數據分成不同的區(qū)間。下面是一個例子:

import pandas as pd

# 創(chuàng)建一個包含連續(xù)數據的Series
data = pd.Series([1, 5, 10, 15, 20, 25, 30])

# 使用cut函數將數據離散化成3個區(qū)間
bins = [0, 10, 20, 30]
labels = ['low', 'medium', 'high']
discretized_data = pd.cut(data, bins, labels=labels)

print(discretized_data)

輸出結果如下:

0       low
1       low
2    medium
3    medium
4    medium
5      high
6      high
dtype: category
Categories (3, object): ['low' < 'medium' < 'high']

在上面的例子中,我們將數據分成了3個區(qū)間:0-10為低(low)、10-20為中等(medium)、20-30為高(high)。

0