溫馨提示×

pandas根據(jù)列去重的方法是什么

Pandas

小億

160

2024-01-27 22:03:20

欄目: 編程語言

pandas根據(jù)列去重的方法是使用drop_duplicates()函數(shù)。該函數(shù)能夠返回一個新的DataFrame，其中的重復值已經(jīng)被刪除。

具體用法如下：

df.drop_duplicates(subset=[列名], keep='first', inplace=True)

subset參數(shù)用于指定要檢查重復的列名或列名列表。默認情況下，該參數(shù)為None，表示檢查所有列。
keep參數(shù)用于指定保留哪一個重復值?？蛇x值有first、last和False。默認為first，表示保留第一個出現(xiàn)的重復值；last表示保留最后一個出現(xiàn)的重復值；False表示刪除所有重復值。
inplace參數(shù)用于指定是否在原DataFrame上進行修改。默認為False，表示返回刪除重復值后的新DataFrame；若設置為True，則在原DataFrame上進行修改，并返回None。

示例：

import pandas as pd

# 創(chuàng)建一個包含重復值的DataFrame
data = {'A': [1, 2, 2, 3, 4, 4],
        'B': ['a', 'b', 'b', 'c', 'd', 'd']}
df = pd.DataFrame(data)

# 根據(jù)列'A'去重
df.drop_duplicates(subset=['A'], keep='first', inplace=True)
print(df)

輸出結果：

在上述示例中，根據(jù)列’A’去重后，保留了第一個出現(xiàn)的重復值。

0 贊

0 踩

最新問答

相關問答

相關標簽

產(chǎn)品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網(wǎng)站二維碼

<button id="fjbyv"><li id="fjbyv"></li></button>