在Pandas中,resample方法用于重新采樣時(shí)間序列數(shù)據(jù)。
使用resample方法的一般語法如下:
df.resample(rule, how, axis, fill_method, closed, label)
其中,常用參數(shù)的含義如下:
rule:重新采樣的規(guī)則??梢允亲址ㄈ纭?Min’表示每5分鐘重新采樣一次)或pandas.DateOffset對象。
how:重新采樣的方法??梢允呛瘮?shù)名(如’mean’表示求均值)或字符串(如’sum’表示求和)。
axis:重新采樣的軸。0表示按行重新采樣,1表示按列重新采樣。默認(rèn)為0。
fill_method:填充方法。對于重采樣頻率增大的情況,可以使用’ffill’或’bfill’進(jìn)行前向或后向填充。默認(rèn)為None。
closed:規(guī)定區(qū)間的開閉情況。'left’表示區(qū)間左閉右開(默認(rèn)),'right’表示區(qū)間左開右閉。
label:重新采樣后的時(shí)間標(biāo)簽位置。'left’表示取區(qū)間左邊界作為標(biāo)簽(默認(rèn)),'right’表示取區(qū)間右邊界作為標(biāo)簽。
下面是一個(gè)使用resample方法重新采樣時(shí)間序列數(shù)據(jù)的示例:
import pandas as pd
# 創(chuàng)建一個(gè)時(shí)間序列數(shù)據(jù)
data = pd.Series([1, 2, 3, 4, 5], index=pd.date_range('2021-01-01', periods=5, freq='D'))
# 按周重新采樣,求和
resampled_data = data.resample('W').sum()
print(resampled_data)
輸出結(jié)果為:
2021-01-03 6
2021-01-10 9
Freq: W-SUN, dtype: int64
在上述示例中,我們創(chuàng)建了一個(gè)包含5個(gè)元素的時(shí)間序列數(shù)據(jù)data,并將其按周重新采樣,并求和得到resampled_data。