在scikit-learn中,雖然主要是用于機(jī)器學(xué)習(xí)任務(wù),但是也可以用來進(jìn)行時間序列分析。下面是一些常用的方法:
from sklearn.model_selection import TimeSeriesSplit
tscv = TimeSeriesSplit(n_splits=5)
for train_index, test_index in tscv.split(X):
X_train, X_test = X[train_index], X[test_index]
y_train, y_test = y[train_index], y[test_index]
# 在這里訓(xùn)練和測試模型
from tsfresh import extract_features
X_features = extract_features(X, default_fc_parameters=MinimalFCParameters())
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)
雖然scikit-learn并不是專門用于時間序列分析的工具庫,但是結(jié)合其他一些時間序列分析庫(如statsmodels、pandas等),可以實現(xiàn)一些基本的時間序列分析任務(wù)。