溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

關(guān)于pandas.DataFrame.drop_duplicates的用法簡介

發(fā)布時(shí)間:2020-07-07 10:52:47 來源:億速云 閱讀:1149 作者:清晨 欄目:開發(fā)技術(shù)

這篇文章主要介紹關(guān)于pandas.DataFrame.drop_duplicates的用法簡介,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

如下所示:

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考慮重復(fù)發(fā)生在哪一列,默認(rèn)考慮所有列,就是在任何一列上出現(xiàn)重復(fù)都算作是重復(fù)數(shù)據(jù)

keep 包含三個(gè)參數(shù)first, last, False,first是指,保留搜索到的第一個(gè)重復(fù)數(shù)據(jù),之后的都刪除;last是指,保留搜索到的最后一個(gè)重復(fù)數(shù)據(jù),之前的搜索到的重復(fù)數(shù)據(jù)都刪除,F(xiàn)alse是指,把所有搜索到的重復(fù)數(shù)據(jù)都刪除,一個(gè)都不保留,即如果有兩行數(shù)據(jù)重復(fù),把兩行數(shù)據(jù)都刪除,而不是保留其中一行。默認(rèn)參數(shù)是first。

補(bǔ)充知識(shí):python3刪除數(shù)據(jù)重復(fù)值,只保留第一項(xiàng)。drop_duplicates()函數(shù)使用介紹

原始數(shù)據(jù)如下:

關(guān)于pandas.DataFrame.drop_duplicates的用法簡介

f 列的前3個(gè)數(shù)據(jù)都有重復(fù)項(xiàng),現(xiàn)在要將重復(fù)值刪去,只保留第一項(xiàng)或最后一項(xiàng)。

使用drop_duplicates()

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重復(fù)值全部被刪除

keep:保留第一個(gè)值,參數(shù)為first,last

inplace:是否替換原來的df,默認(rèn)為False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#讀取文件數(shù)據(jù),并將列命名為abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

結(jié)果:

關(guān)于pandas.DataFrame.drop_duplicates的用法簡介

可以看到 f 列中的重復(fù)值都被刪除,且保留了第一項(xiàng)

以上是關(guān)于pandas.DataFrame.drop_duplicates的用法簡介的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI