您好,登錄后才能下訂單哦!
這篇文章主要介紹“Python drop()刪除行列的操作方法有哪些”的相關(guān)知識(shí),小編通過實(shí)際案例向大家展示操作過程,操作方法簡單快捷,實(shí)用性強(qiáng),希望這篇“Python drop()刪除行列的操作方法有哪些”文章能幫助大家解決問題。
在進(jìn)行特征工程、劃分?jǐn)?shù)據(jù)集的工作中,drop()函數(shù)都能派上用場(chǎng)。它可以輕松剔除數(shù)據(jù)、操作列和操作行等。
drop()詳細(xì)的語法如下:
刪除行是index,刪除列是columns:
DataFrame.drop(labels=None, axis=0, index=None, columns=None, inplace=False)
參數(shù):
labels:要?jiǎng)h除的行或列的標(biāo)簽,可以是單個(gè)標(biāo)簽,也可以是標(biāo)簽列表。
axis:要?jiǎng)h除的行或列的軸,0表示行,1表示列。
index:要?jiǎng)h除的行的索引,可以是單個(gè)索引,也可以是索引列表。
columns:要?jiǎng)h除的列的列名,可以是單個(gè)列名,也可以是列名列表。
inplace:是否在原DataFrame上進(jìn)行操作,默認(rèn)為False,即不在原DataFrame上進(jìn)行操作。
使用場(chǎng)景1:刪除不需要的特征。
例如:有些特征對(duì)結(jié)果的影響不大,就可以把與因變量不相關(guān)的自變量刪掉;為了避免多重共線性,要把有強(qiáng)相關(guān)關(guān)系的自變量刪掉。
df = data.drop(data[['RowNumber','CustomerId','Surname']],axis=1) df
代碼講解:
data是數(shù)據(jù)集,兩個(gè)中括號(hào)代表DataFrame格式,里面篩選了3個(gè)要?jiǎng)h除的字段;
axis=1代表操作列;
運(yùn)行結(jié)果:
使用場(chǎng)景2:把因變量刪掉
# 自變量、因變量 x_data = df.drop(['Exited'],axis=1) y_data = df['Exited'] x_data
代碼講解:
drop()函數(shù)里面填寫要?jiǎng)h除的字段,表示從df中刪除名為“Exited”的列;
['Exited']這一個(gè)字段是我們要剔除的因變量,單個(gè)字段可以這樣表示;
運(yùn)行結(jié)果:
使用場(chǎng)景3:在劃分?jǐn)?shù)據(jù)集的時(shí)候,生成了訓(xùn)練集,把被分到訓(xùn)練集的樣本剔除掉,剩下的就是測(cè)試集了。
#劃分訓(xùn)練集 train_data = data.sample(frac = 0.8, random_state = 0) #測(cè)試集 test_data = data.drop(train_data.index)
代碼講解:
drop()函數(shù)里面填行索引可以刪除掉行;
train_data是我們劃分好的訓(xùn)練集,train_data.index表示行索引;
axis=0,表示的是刪除行,也可以不寫,是默認(rèn)值;
關(guān)于“Python drop()刪除行列的操作方法有哪些”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí),可以關(guān)注億速云行業(yè)資訊頻道,小編每天都會(huì)為大家更新不同的知識(shí)點(diǎn)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。