您好,登錄后才能下訂單哦!
這篇文章主要介紹關(guān)于pandas.DataFrame.drop_duplicates的用法簡介,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
如下所示:
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
subset考慮重復(fù)發(fā)生在哪一列,默認(rèn)考慮所有列,就是在任何一列上出現(xiàn)重復(fù)都算作是重復(fù)數(shù)據(jù)
keep 包含三個(gè)參數(shù)first, last, False,first是指,保留搜索到的第一個(gè)重復(fù)數(shù)據(jù),之后的都刪除;last是指,保留搜索到的最后一個(gè)重復(fù)數(shù)據(jù),之前的搜索到的重復(fù)數(shù)據(jù)都刪除,F(xiàn)alse是指,把所有搜索到的重復(fù)數(shù)據(jù)都刪除,一個(gè)都不保留,即如果有兩行數(shù)據(jù)重復(fù),把兩行數(shù)據(jù)都刪除,而不是保留其中一行。默認(rèn)參數(shù)是first。
補(bǔ)充知識(shí):python3刪除數(shù)據(jù)重復(fù)值,只保留第一項(xiàng)。drop_duplicates()函數(shù)使用介紹
原始數(shù)據(jù)如下:
f 列的前3個(gè)數(shù)據(jù)都有重復(fù)項(xiàng),現(xiàn)在要將重復(fù)值刪去,只保留第一項(xiàng)或最后一項(xiàng)。
使用drop_duplicates()
drop_duplicates(self, subset=None, keep='first', inplace=False)
subset :如['a']代表a列中的重復(fù)值全部被刪除
keep:保留第一個(gè)值,參數(shù)為first,last
inplace:是否替換原來的df,默認(rèn)為False
import pandas as pd data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) #讀取文件數(shù)據(jù),并將列命名為abcdef data.drop_duplicates(subset='f', keep='first', inplace=True) print(data)
結(jié)果:
可以看到 f 列中的重復(fù)值都被刪除,且保留了第一項(xiàng)
以上是關(guān)于pandas.DataFrame.drop_duplicates的用法簡介的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。