溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python重復(fù)值如何處理

發(fā)布時間:2022-05-19 09:16:27 來源:億速云 閱讀:294 作者:zzz 欄目:開發(fā)技術(shù)

本文小編為大家詳細介紹“python重復(fù)值如何處理”,內(nèi)容詳細,步驟清晰,細節(jié)處理妥當(dāng),希望這篇“python重復(fù)值如何處理”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學(xué)習(xí)新知識吧。

今天,先處理重復(fù)值,首先創(chuàng)建一個包含重復(fù)值的DataFrame,如下:

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[3,4]],columns = ['a','b'])
print(data)

我們將其打印出來,結(jié)果如下:

python重復(fù)值如何處理

可以看出來第一第二行是重復(fù)的,這里的數(shù)據(jù)量比較少,可以直接肉眼觀察,但如果數(shù)據(jù)量多的時候,我們就需要用到diplicated()函數(shù)來查詢了,我們用它來查查上面data的重復(fù)值。

data[data.duplicated()]

我們可以看出,它把索引為1的行打印了出來,如果有3行一樣的呢?我們下面來試試!

python重復(fù)值如何處理

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[1,2],[3,4]],columns = ['a','b'])
data[data.duplicated()]

其結(jié)果如下:

python重復(fù)值如何處理

可以看出,重復(fù)項出了第一個出現(xiàn)的數(shù)據(jù)外,都會顯示出來。

如果想統(tǒng)計出一共有多少行重復(fù)了,我們就可以用到sum()函數(shù),代碼如下:

data.duplicated().sum()

python重復(fù)值如何處理

很多情況下,我們都需要刪除掉重復(fù)的數(shù)據(jù),這時候我們就可以用到drop_duplicated()函數(shù),我們將data的重復(fù)行刪除掉試試!

data.drop_duplicated()

剛執(zhí)行代碼時發(fā)生了錯誤,原來是duplicates而不是duplicated!

python重復(fù)值如何處理

但是要注意,用drop_duplicates()刪除重復(fù)項并不會影響data的結(jié)構(gòu),如果你要把data結(jié)構(gòu)改掉就要重新賦值。如果要用來刪除某列的重復(fù)值的話,直接在括號內(nèi)加上列名即可。

如下:

python重復(fù)值如何處理

讀到這里,這篇“python重復(fù)值如何處理”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會,如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI