溫馨提示×

Scikit-learn中怎么分割數(shù)據(jù)集為訓(xùn)練集和測試集

小億
118
2024-05-10 17:02:56
欄目: 編程語言

可以使用train_test_split函數(shù)來分割數(shù)據(jù)集為訓(xùn)練集和測試集。具體操作如下:

from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

其中,X為特征數(shù)據(jù)集,y為標簽數(shù)據(jù)集,test_size為測試集所占比例(通常取0.2表示20%的數(shù)據(jù)作為測試集),random_state為隨機種子,可以保證每次運行時劃分的訓(xùn)練集和測試集是一樣的。分割后,X_trainy_train為訓(xùn)練集的特征和標簽,X_testy_test為測試集的特征和標簽。

0