python怎么隨機(jī)劃分?jǐn)?shù)據(jù)集

小億
179
2023-12-21 17:53:57

在Python中,可以使用scikit-learn庫(kù)中的train_test_split函數(shù)來(lái)隨機(jī)劃分?jǐn)?shù)據(jù)集。train_test_split函數(shù)將數(shù)據(jù)集隨機(jī)劃分為訓(xùn)練集和測(cè)試集。

以下是使用train_test_split函數(shù)隨機(jī)劃分?jǐn)?shù)據(jù)集的示例代碼:

from sklearn.model_selection import train_test_split

# 假設(shè)X是特征矩陣,y是目標(biāo)向量
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

在上述代碼中,X是特征矩陣,y是目標(biāo)向量,test_size參數(shù)指定測(cè)試集所占的比例(例如0.2表示測(cè)試集占總數(shù)據(jù)集的20%),random_state參數(shù)用于設(shè)置隨機(jī)種子,以確保每次運(yùn)行代碼時(shí)得到的隨機(jī)劃分結(jié)果相同。

train_test_split函數(shù)的返回值是劃分后的訓(xùn)練集和測(cè)試集的特征矩陣和目標(biāo)向量。在上述示例代碼中,X_train和y_train是訓(xùn)練集的特征矩陣和目標(biāo)向量,X_test和y_test是測(cè)試集的特征矩陣和目標(biāo)向量。

使用劃分好的訓(xùn)練集和測(cè)試集進(jìn)行機(jī)器學(xué)習(xí)模型的訓(xùn)練和評(píng)估。

0