您好,登錄后才能下訂單哦!
pandas讀取一組數(shù)據(jù),可能存在重復(fù)索引,雖然可以利用drop_duplicate直接刪除,但是會(huì)刪除重要信息。
比如同一ID用戶,多次登錄學(xué)習(xí)時(shí)間。要計(jì)算該用戶總共‘'學(xué)習(xí)時(shí)間‘',就要把重復(fù)的ID的‘'學(xué)習(xí)時(shí)間‘'累加。
可以結(jié)合groupby和sum函數(shù)完成該操作。
實(shí)例如下:
新建一個(gè)DataFrame,計(jì)算每個(gè) id 的總共學(xué)習(xí)時(shí)間。其中 id 為one/two的存在重復(fù)學(xué)習(xí)時(shí)間。先利用 groupby 按照鍵 id 分組,然后利用sum()函數(shù)求和,即可得到每個(gè)id的總共學(xué)習(xí)時(shí)間。
以上這篇對(duì)DataFrame數(shù)據(jù)中的重復(fù)行,利用groupby累加合并的方法詳解就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。