溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

python重復(fù)值如何處理

發(fā)布時間：2022-05-19 09:16:27 來源：億速云閱讀：294 作者：zzz 欄目：開發(fā)技術(shù)

本文小編為大家詳細介紹“python重復(fù)值如何處理”，內(nèi)容詳細，步驟清晰，細節(jié)處理妥當(dāng)，希望這篇“python重復(fù)值如何處理”文章能幫助大家解決疑惑，下面跟著小編的思路慢慢深入，一起來學(xué)習(xí)新知識吧。

今天，先處理重復(fù)值，首先創(chuàng)建一個包含重復(fù)值的DataFrame,如下：

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[3,4]],columns = ['a','b'])
print(data)

我們將其打印出來，結(jié)果如下：

python重復(fù)值如何處理

可以看出來第一第二行是重復(fù)的，這里的數(shù)據(jù)量比較少，可以直接肉眼觀察，但如果數(shù)據(jù)量多的時候，我們就需要用到diplicated()函數(shù)來查詢了，我們用它來查查上面data的重復(fù)值。

data[data.duplicated()]

我們可以看出，它把索引為1的行打印了出來，如果有3行一樣的呢？我們下面來試試！

python重復(fù)值如何處理

import pandas as pd
data = pd.DataFrame([[1,2],[1,2],[1,2],[3,4]],columns = ['a','b'])
data[data.duplicated()]

其結(jié)果如下：

python重復(fù)值如何處理

可以看出，重復(fù)項出了第一個出現(xiàn)的數(shù)據(jù)外，都會顯示出來。

如果想統(tǒng)計出一共有多少行重復(fù)了，我們就可以用到sum()函數(shù)，代碼如下：

data.duplicated().sum()

python重復(fù)值如何處理

很多情況下，我們都需要刪除掉重復(fù)的數(shù)據(jù)，這時候我們就可以用到drop_duplicated()函數(shù)，我們將data的重復(fù)行刪除掉試試！

data.drop_duplicated()

剛執(zhí)行代碼時發(fā)生了錯誤，原來是duplicates而不是duplicated!

python重復(fù)值如何處理

但是要注意，用drop_duplicates()刪除重復(fù)項并不會影響data的結(jié)構(gòu)，如果你要把data結(jié)構(gòu)改掉就要重新賦值。如果要用來刪除某列的重復(fù)值的話，直接在括號內(nèi)加上列名即可。

如下：

python重復(fù)值如何處理

讀到這里，這篇“python重復(fù)值如何處理”文章已經(jīng)介紹完畢，想要掌握這篇文章的知識點還需要大家自己動手實踐使用過才能領(lǐng)會，如果想了解更多相關(guān)內(nèi)容的文章，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
怎么用Vue+NodeJS實現(xiàn)大文件上傳
下一篇新聞：
Python浮點數(shù)乘法和整形乘除法的效率實例分析

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<li id="90yf1"><form id="90yf1"></form></li>

<big id="90yf1"></big>