溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

用Python3秒鐘完成別人半天的工作量!不用Excel了?

發(fā)布時間:2020-08-15 13:48:48 來源:ITPUB博客 閱讀:166 作者:千鋒Python唐小強 欄目:編程語言

做過數(shù)據(jù)分析的程序員都知道:Excel、Tableau等這些親民工具都是數(shù)據(jù)分析的得力助手。

但用Excel做分析,繁瑣的每一步都是來自鼠標(biāo)點擊,中間如果一步有誤,很多步驟都需要重新調(diào)整,浪費大量時間。

這不,前天臨近下班時間,老板突然Q我:算一下近一年銷售額總額TOP5的品牌以及對應(yīng)的銷售額。

接收完文檔我傻眼了, 公司旗下有20個品牌,這些品牌涉及到128個類目,業(yè)務(wù)部門總共發(fā)來了128張表,每一份表格對應(yīng)著一個細(xì)分行業(yè)的數(shù)據(jù),像什么各類戶外服裝、垂釣裝備、救生裝備應(yīng)有盡有。

用Python3秒鐘完成別人半天的工作量!不用Excel了?

每張表,以月的維度記錄著每個品牌的日期、訪客、客單、轉(zhuǎn)化、所屬類目(細(xì)分行業(yè))等數(shù)據(jù):

用Python3秒鐘完成別人半天的工作量!不用Excel了?

習(xí)慣性的打開Excel,我開始盤算:最終需求是要篩選出近一年銷售額總和排名前5的品牌,這一攤子數(shù)據(jù),對單獨的一張表進(jìn)行分類匯總,能夠得到該細(xì)分行業(yè)各品牌的銷售額, 想要得到所有行業(yè)的銷售額總和,得分類匯總128次,最后對128次結(jié)果再次合并。

“這個任務(wù)看上去很艱巨,不過,考驗的主要是體力?!蔽乙谎劬汀翱创绷耸虑榈谋举|(zhì),右手食指在鼠標(biāo)上飛速跳動,以90秒一張表格的速度瘋狂推進(jìn)。按照這個速度,不考慮疲勞值對速度的拖累,大概 3.2個小時就能夠完成任務(wù)。

然而,剛開始還 沒3分鐘,老板找到我:剛交你的任務(wù)暫時不用做了, 新來的已經(jīng)得出結(jié)論了,看著還挺專業(yè)。

用Python3秒鐘完成別人半天的工作量!不用Excel了?

多年來的職業(yè)敏感性驅(qū)使我立馬跟新同事聊了一下,“剛剛那些表分分鐘就搞定了,很簡單!”他演示給我看,“ 我就使用了幾行Python代碼......

首先,導(dǎo)入模塊,打開單個表格:

用Python3秒鐘完成別人半天的工作量!不用Excel了?

接著,匯總不同品牌在這個細(xì)分行業(yè)下的銷售額,沒有銷售額的字段,可以通過訪客數(shù)*轉(zhuǎn)化率*客單價三者的乘積來計算:

用Python3秒鐘完成別人半天的工作量!不用Excel了?

按品牌來匯總銷售額,得到近一年各品牌銷售額合計:

用Python3秒鐘完成別人半天的工作量!不用Excel了?

對于單獨行業(yè)的銷售額,應(yīng)該加一個區(qū)分的標(biāo)簽以防覆蓋,而打開時候的文件名,具有天然的區(qū)分和防覆蓋優(yōu)勢,但要注意去掉文件的后綴。

用Python3秒鐘完成別人半天的工作量!不用Excel了?

OK,單個表格處理完成,我們把這一系列操作推而廣之即可。用os.listdir方法來遍歷文件名,批量循環(huán)訪問并處理文件,同時引入time計時,打算看一看,面對128張表,Python完成這些操作到底能夠比手動快多少:

用Python3秒鐘完成別人半天的工作量!不用Excel了?

WOC,整個過程一氣呵成,不到3秒,平均一張表格0.02秒!真香!

為了確保數(shù)據(jù)正常,來預(yù)覽一下:

用Python3秒鐘完成別人半天的工作量!不用Excel了?

這一串看起來很奇怪的銷售額,是pandas自作主張把實際銷售額變成了科學(xué)記數(shù)法形式來展示,要還原數(shù)值,需要更改一下原始的設(shè)置:

用Python3秒鐘完成別人半天的工作量!不用Excel了?

我本以為學(xué)會Excel走遍天下,沒想到Python效率這么高!

20年前,學(xué)英語不是為了成為翻譯員;10年前,學(xué)電腦不是為了成為打字員;今天,學(xué)Python數(shù)據(jù)分析與挖掘不是要都成為數(shù)據(jù)分析師。

而越來越多的互聯(lián)網(wǎng)人利用Python完成自動化辦公、表格處理、信息搜集、數(shù)據(jù)分析、數(shù)據(jù)可視化等工作,至少釋放了80%的勞動力!

我們知道什么樣的程序員最受歡迎?

肯定不是只會寫代碼的碼農(nóng),而是技術(shù)過硬又懂業(yè)務(wù)的,可以 通過數(shù)據(jù)分析,優(yōu)化代碼解決實際業(yè)務(wù)問題的人才!

其實無論是做研發(fā)、系統(tǒng)架構(gòu),還是產(chǎn)品、運營,在數(shù)不清的場景下, 用Python做數(shù)據(jù)分析與挖掘其實是基本功,它不是一個職位,而是一個技能。

這里整理了一些Python數(shù)據(jù)分析視頻教程,想著有用得上的伙伴,回復(fù):數(shù)據(jù)分析,領(lǐng)??!

Python最新數(shù)據(jù)分析入門教程https://pan.baidu.com/s/1So1X4-uNgXcNurJDJFPPAA ?。?!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI