您好,登錄后才能下訂單哦!
本文小編為大家詳細(xì)介紹“python數(shù)據(jù)實(shí)例分析”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“python數(shù)據(jù)實(shí)例分析”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來學(xué)習(xí)新知識(shí)吧。
假設(shè)我們的數(shù)據(jù)是這樣的,無異常無缺失值,下面我通過幾個(gè)問題,我們來練習(xí)用Pandas進(jìn)行探索性數(shù)據(jù)分析~
year | name | salary | title |
---|---|---|---|
2001 | aa | 1500 | first |
2002 | bb | 4300 | first |
2003 | cc | 7000 | second |
2001 | dd | 5000 | third |
我們將數(shù)據(jù)讀取后命名為df
import pandas as pd
df['salary'].max()
同樣的,最低(min)、平均(mean)。
突然想到了SQL,是不是一句話的事情,select...from...where... 當(dāng)然,我們的pandas也是一句話的事情:
df[df['name']=='bb']['salary']
那我們就定位到收入最高的行~
df[df['salary']==df['salary'].max()]
# or
df.loc[df['salary'].idxmax()]
是不是自然而然想到了分組,group by?
df.groupby('year').mean()['salary']
這里使用nunique()函數(shù),之前有一個(gè)小伙伴和我交流中就發(fā)現(xiàn)沒有搞懂nunique()函數(shù)和unique()函數(shù)之間的區(qū)別,現(xiàn)在應(yīng)該懂了吧?
df['title'].nunique()
讀到這里,這篇“python數(shù)據(jù)實(shí)例分析”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識(shí)點(diǎn)還需要大家自己動(dòng)手實(shí)踐使用過才能領(lǐng)會(huì),如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。