溫馨提示×

Pandas中resample方法怎么使用

小億
181
2023-08-12 03:44:37
欄目: 編程語言

在Pandas中,resample方法用于重新采樣時(shí)間序列數(shù)據(jù)。

使用resample方法的一般語法如下:

df.resample(rule, how, axis, fill_method, closed, label)

其中,常用參數(shù)的含義如下:

  • rule:重新采樣的規(guī)則??梢允亲址ㄈ纭?Min’表示每5分鐘重新采樣一次)或pandas.DateOffset對象。

  • how:重新采樣的方法??梢允呛瘮?shù)名(如’mean’表示求均值)或字符串(如’sum’表示求和)。

  • axis:重新采樣的軸。0表示按行重新采樣,1表示按列重新采樣。默認(rèn)為0。

  • fill_method:填充方法。對于重采樣頻率增大的情況,可以使用’ffill’或’bfill’進(jìn)行前向或后向填充。默認(rèn)為None。

  • closed:規(guī)定區(qū)間的開閉情況。'left’表示區(qū)間左閉右開(默認(rèn)),'right’表示區(qū)間左開右閉。

  • label:重新采樣后的時(shí)間標(biāo)簽位置。'left’表示取區(qū)間左邊界作為標(biāo)簽(默認(rèn)),'right’表示取區(qū)間右邊界作為標(biāo)簽。

下面是一個(gè)使用resample方法重新采樣時(shí)間序列數(shù)據(jù)的示例:

import pandas as pd
# 創(chuàng)建一個(gè)時(shí)間序列數(shù)據(jù)
data = pd.Series([1, 2, 3, 4, 5], index=pd.date_range('2021-01-01', periods=5, freq='D'))
# 按周重新采樣,求和
resampled_data = data.resample('W').sum()
print(resampled_data)

輸出結(jié)果為:

2021-01-03    6
2021-01-10    9
Freq: W-SUN, dtype: int64

在上述示例中,我們創(chuàng)建了一個(gè)包含5個(gè)元素的時(shí)間序列數(shù)據(jù)data,并將其按周重新采樣,并求和得到resampled_data。

0