溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

python操作excel實(shí)現(xiàn)數(shù)據(jù)清洗的示例

發(fā)布時(shí)間:2021-03-02 11:00:21 來源:億速云 閱讀:457 作者:清風(fēng) 欄目:編程語言

本文將為大家詳細(xì)介紹“python操作excel實(shí)現(xiàn)數(shù)據(jù)清洗的示例”,內(nèi)容步驟清晰詳細(xì),細(xì)節(jié)處理妥當(dāng),而小編每天都會(huì)更新不同的知識(shí)點(diǎn),希望這篇“python操作excel實(shí)現(xiàn)數(shù)據(jù)清洗的示例”能夠給你意想不到的收獲,請(qǐng)大家跟著小編的思路慢慢深入,具體內(nèi)容如下,一起去收獲新知識(shí)吧。

Python主要用來做什么

Python主要應(yīng)用于:1、Web開發(fā);2、數(shù)據(jù)科學(xué)研究;3、網(wǎng)絡(luò)爬蟲;4、嵌入式應(yīng)用開發(fā);5、游戲開發(fā);6、桌面應(yīng)用開發(fā)。

python 在對(duì) excel 操作的同時(shí),前面文章中說了數(shù)據(jù)的讀取、插入、簡單分析,還有一個(gè)非常重要的點(diǎn)就是數(shù)據(jù)清洗。那什么叫數(shù)據(jù)清洗,說白了就是去除數(shù)據(jù)文本中的垃圾值,比如:存在的空值、多余的空格、數(shù)據(jù)格式等等的處理。

1,導(dǎo)入 python 庫、讀取 excel 數(shù)據(jù)
# 導(dǎo)入 pandas 庫import pandas as pd# read_excel() 讀取 excel 數(shù)據(jù)# DataFrame() 將讀取到的數(shù)據(jù)轉(zhuǎn)換為 DataFrame 數(shù)據(jù)df = pd.DataFrame(pd.read_excel('data.xlsx'))
2,數(shù)據(jù)清洗(去除空值)
# dropna() 函數(shù)去除 df 數(shù)據(jù)表中存在空值的所有行df.dropna(how='any')# mean() 函數(shù)計(jì)算 age 字段所在列的平均值age_pre = df['age'].mean()# 使用 fillna() 函數(shù)對(duì)存在的空值進(jìn)行填充,將 age_pre 的值填充到字段為空的值內(nèi)面df['age'].fillna(age_pre)
3,數(shù)據(jù)清洗(清除字段中的空格)
# 清除字段的空格df['name'] = df['name'].map(str.strip)
4,數(shù)據(jù)清洗(對(duì)某個(gè)列進(jìn)行重命名)
# rename() 函數(shù)對(duì)列進(jìn)行重命名df.rename(columns={'name': 'name_new'})
5,數(shù)據(jù)清洗(清除某一列中的重復(fù)值)
# 從前往后查找某個(gè)列中的重復(fù)值,如果存在則清除后面所出現(xiàn)的重復(fù)值df['name'].drop_duplicates()# 從后往前查找某個(gè)列中的重復(fù)值,如果存在則清除前面所出現(xiàn)的重復(fù)值df['city'].drop_duplicates(keep='last')# 兩種正好是按照相反的清除順序
6,數(shù)據(jù)清洗(數(shù)據(jù)值替換)
# 將某一列中的具體值進(jìn)行替換df['name'].replace('laow', 'lwsbc')

如果你能讀到這里,小編希望你對(duì)“python操作excel實(shí)現(xiàn)數(shù)據(jù)清洗的示例”這一關(guān)鍵問題有了從實(shí)踐層面最深刻的體會(huì),具體使用情況還需要大家自己動(dòng)手實(shí)踐使用過才能領(lǐng)會(huì),如果想閱讀更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI