溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Pandas中怎么分組再取N項(xiàng)

發(fā)布時(shí)間:2021-10-21 17:16:43 來源:億速云 閱讀:124 作者:iii 欄目:web開發(fā)

本篇內(nèi)容介紹了“Pandas中怎么分組再取N項(xiàng)”的有關(guān)知識(shí),在實(shí)際案例的操作過程中,不少人都會(huì)遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

在 pandas 中,DataFrame 是我們經(jīng)常用到的工具。有時(shí)候,我們可能會(huì)需要對(duì)數(shù)據(jù)按某個(gè)字段進(jìn)行分組,然后每個(gè)組取N項(xiàng)。例如:

Pandas中怎么分組再取N項(xiàng)

現(xiàn)在,我想每個(gè)職位任取三個(gè)用戶。

相信有同學(xué)會(huì)使用 for 循環(huán),依次循環(huán)每一行,每個(gè)職位選3個(gè),存入一個(gè)臨時(shí)的列表里面。循環(huán)完成以后再轉(zhuǎn)成一個(gè)新的  DataFrame。但這個(gè)方式顯然不夠智能。

那么,我們有沒有什么辦法能夠不使用循環(huán)就做到這一步呢?也許有同學(xué)想到了使用 groupby。我們來看看效果。

Pandas中怎么分組再取N項(xiàng)

看起來僅僅是統(tǒng)計(jì)了每個(gè)職位的數(shù)量。那么,如何才能保留所有字段呢?

實(shí)際上我們可以把.size()改成.head(3):

Pandas中怎么分組再取N項(xiàng)

看起來這里的.head(3)似乎沒有什么作用。這個(gè)時(shí)候,我們思考一下 Python  里面,如果要使用itertools.groupby,官方文檔里面有這樣一段話:

Generally, the iterable needs to already be sorted on the same key  function.

如下圖所示:

Pandas中怎么分組再取N項(xiàng)

這段話告訴我們,要使用itertools.groupby,我們需要提前對(duì)被分組的字段進(jìn)行排序。

那么,我們?cè)囈辉囋谌绻崆皩?duì) DataFrame 進(jìn)行排序,然后再 groupby 會(huì)怎么樣:

Pandas中怎么分組再取N項(xiàng)

成功了。每個(gè)職位都取了3個(gè)。

可能大家發(fā)現(xiàn)最左邊的索引是亂序,看起來不好看。那么我們還可以重設(shè)一下索引:

Pandas中怎么分組再取N項(xiàng)

“Pandas中怎么分組再取N項(xiàng)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI