您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“數(shù)據(jù)庫中怎么批量處理分析數(shù)據(jù)”的有關(guān)知識(shí),在實(shí)際案例的操作過程中,不少人都會(huì)遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
需求
:有20個(gè)品牌共生產(chǎn)了127個(gè)類目的產(chǎn)品,篩選出近一年銷售額總額TOP5的品牌
以及對(duì)應(yīng)的銷售額。
思路
:先做第一個(gè)然后如法炮制將結(jié)果匯總即可。
數(shù)據(jù)信息如下:
加載數(shù)據(jù):
接著,是要匯總不同品牌在這個(gè)細(xì)分行業(yè)下的銷售額,我們要匯總的是各品牌近一年(2018年9月-2019年8月)的銷售額,先看看日期是否正確:
每個(gè)品牌每個(gè)月份銷售額計(jì)算如下:
按照品牌分組計(jì)算銷售額總和前五的品牌:
這里有個(gè)細(xì)節(jié),最終要匯總的是所有細(xì)分行業(yè)的銷售額top5,給所屬類別添加標(biāo)簽。
最終最終結(jié)果:
import time start = time.time()result = pd.DataFrame()for name in os.listdir():df = pd.read_excel(name)df['銷售額']= df['訪客數(shù)']* df['轉(zhuǎn)化率']*df['客單價(jià)']df_sum = df.groupby('品牌',)['銷售額'].sum().reset_index()df_sum['類目'] = name.replace(".xlsx","")result = pd.concat([result,df_sum])final = result.groupby('品牌')['銷售額'].sum().reset_index().sort_values('銷售額',ascending=False)final.head()
看起來很奇怪的銷售額,是pandas自作主張把實(shí)際銷售額變成了 科學(xué)記數(shù)法 形式來展示,要還原數(shù)值,需要更改一下原始的設(shè)置:
“數(shù)據(jù)庫中怎么批量處理分析數(shù)據(jù)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí)可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。