關(guān)于pandas.DataFrame.drop_duplicates的用法簡介

發(fā)布時(shí)間：2020-07-07 10:52:47 來源：億速云閱讀：1149 作者：清晨欄目：開發(fā)技術(shù)

這篇文章主要介紹關(guān)于pandas.DataFrame.drop_duplicates的用法簡介，文中介紹的非常詳細(xì)，具有一定的參考價(jià)值，感興趣的小伙伴們一定要看完！

如下所示：

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)

subset考慮重復(fù)發(fā)生在哪一列，默認(rèn)考慮所有列，就是在任何一列上出現(xiàn)重復(fù)都算作是重復(fù)數(shù)據(jù)

keep 包含三個(gè)參數(shù)first, last, False，first是指，保留搜索到的第一個(gè)重復(fù)數(shù)據(jù)，之后的都刪除；last是指，保留搜索到的最后一個(gè)重復(fù)數(shù)據(jù)，之前的搜索到的重復(fù)數(shù)據(jù)都刪除，F(xiàn)alse是指，把所有搜索到的重復(fù)數(shù)據(jù)都刪除，一個(gè)都不保留，即如果有兩行數(shù)據(jù)重復(fù)，把兩行數(shù)據(jù)都刪除，而不是保留其中一行。默認(rèn)參數(shù)是first。

補(bǔ)充知識(shí)：python3刪除數(shù)據(jù)重復(fù)值，只保留第一項(xiàng)。drop_duplicates（）函數(shù)使用介紹

原始數(shù)據(jù)如下：

關(guān)于pandas.DataFrame.drop_duplicates的用法簡介

f 列的前3個(gè)數(shù)據(jù)都有重復(fù)項(xiàng)，現(xiàn)在要將重復(fù)值刪去，只保留第一項(xiàng)或最后一項(xiàng)。

使用drop_duplicates（）

drop_duplicates(self, subset=None, keep='first', inplace=False)

subset :如['a']代表a列中的重復(fù)值全部被刪除

keep:保留第一個(gè)值，參數(shù)為first,last

inplace:是否替換原來的df,默認(rèn)為False

import pandas as pd
data = pd.read_table("C:/Users/xujinhua/Desktop/aa/a.txt",header=None, names=['a','b','c','d','e','f','g']) 
#讀取文件數(shù)據(jù)，并將列命名為abcdef
data.drop_duplicates(subset='f', keep='first', inplace=True)
print(data)

結(jié)果：

關(guān)于pandas.DataFrame.drop_duplicates的用法簡介

可以看到 f 列中的重復(fù)值都被刪除,且保留了第一項(xiàng)

以上是關(guān)于pandas.DataFrame.drop_duplicates的用法簡介的所有內(nèi)容，感謝各位的閱讀！希望分享的內(nèi)容對(duì)大家有幫助，更多相關(guān)知識(shí)，歡迎關(guān)注億速云行業(yè)資訊頻道！

向AI問一下細(xì)節(jié)

關(guān)于pandas.DataFrame.drop_duplicates的用法簡介

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽