溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Python如何用Jupyter來(lái)做數(shù)據(jù)分析

發(fā)布時(shí)間:2021-10-09 17:17:57 來(lái)源:億速云 閱讀:324 作者:柒染 欄目:大數(shù)據(jù)

Python如何用Jupyter來(lái)做數(shù)據(jù)分析,針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。

加載一個(gè)Jupyter插件后,無(wú)需寫(xiě)代碼就能做數(shù)據(jù)分析,  還幫你生成相應(yīng)代碼?
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
沒(méi)錯(cuò),只需要加載這個(gè)名為  Mito的小工具包,用Python做數(shù)據(jù)分析,變得和用Excel一樣簡(jiǎn)單:
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
運(yùn)行速度比Excel更快,也不需要到處搜各種Python教程了。

好用如Excel,更快更全面

Mito是Jupyter notebook的一個(gè)  可編輯電子表格插件,在編輯  .csv表格  (帶格式轉(zhuǎn)換功能)時(shí),就能生成相關(guān)Python代碼。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析Mito,線粒體Mitochondria的縮寫(xiě)
具體來(lái)說(shuō),Mito的出現(xiàn),像是將  Python的強(qiáng)大功能、和  Excel的易用性進(jìn)行了結(jié)合。
只需要掌握Excel的用法,就能使用Python的數(shù)據(jù)分析功能,還能將寫(xiě)出來(lái)的代碼“打包帶走”。
它彌補(bǔ)了Excel在數(shù)據(jù)分析上的幾個(gè)  缺陷
  • Excel無(wú)法做大數(shù)據(jù)分析(大型數(shù)據(jù)集處理得不好)

  • Excel運(yùn)行緩慢

  • Excel無(wú)法輕松創(chuàng)建可重復(fù)流程

同時(shí),又比SQL和Python更  簡(jiǎn)單、直觀。畢竟這些專(zhuān)業(yè)工具對(duì)于0基礎(chǔ)初學(xué)者來(lái)說(shuō),需要至少幾年時(shí)間,才能完全上手。
據(jù)Mito內(nèi)測(cè)用戶表示,這款插件讓他們用Python做數(shù)據(jù)分析的效率提升了  10倍,因?yàn)橛脩艨梢灾苯釉贛ito里編寫(xiě)Excel公式,如=SUM(A1, 100)。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
那么,Mito是怎么做到將Excel邏輯轉(zhuǎn)換成Python代碼的呢?
作者們編寫(xiě)了一種名為  Transpiler的程序,有點(diǎn)類(lèi)似于編譯器的功能,采用  抽象語(yǔ)法樹(shù)  (AST),解析Excel源代碼,并轉(zhuǎn)換成Python的源代碼。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
相比于采用專(zhuān)業(yè)軟件如Alteryx  (需要5000美元/月)進(jìn)行數(shù)據(jù)分析,Mito所生成的Python代碼可以根據(jù)需要自行修改,靈活性更高一點(diǎn)。
目前,Mito采用  亞馬遜云平臺(tái)   (AWS)保存用戶的相關(guān)數(shù)據(jù),每個(gè)用戶擁有一個(gè)獨(dú)立賬戶。
當(dāng)然,用戶也可以選擇將數(shù)據(jù)保存在本地。

自動(dòng)生成Python代碼

以分析美國(guó)各州的“家庭平均收入”和“允許托運(yùn)的火車(chē)站數(shù)量”這兩個(gè)數(shù)據(jù)的關(guān)系為例。
首先,  上傳“家庭平均收入”和“允許托運(yùn)的火車(chē)站數(shù)量”兩份數(shù)據(jù)。
數(shù)據(jù)處理的格式是.csv,當(dāng)然也可以輸入Excel文件,并用Mito轉(zhuǎn)成兩份.csv文件。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
然后,將這兩份數(shù)據(jù)集  合并在一起,只需要用鼠標(biāo)勾選對(duì)應(yīng)功能、選中相關(guān)數(shù)據(jù)列就行。
啪!代碼就生成好了。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
然后,是做  數(shù)據(jù)透視表,在完成分組后,采用聚合  (aggregate)功能來(lái)切換聚合方法。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
還包括  數(shù)據(jù)過(guò)濾功能,同樣立刻就能生成相關(guān)代碼。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
包含升降序  排序功能,快速簡(jiǎn)潔。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
然后就是相關(guān)數(shù)據(jù)統(tǒng)計(jì)、分析出結(jié)果了,流程直觀。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
保存分析文件的方法也很簡(jiǎn)單,文件是以Python編寫(xiě)的,而不是用比較難懂的VBA。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
要想重復(fù)上面的步驟的話,也非常容易,Mito自帶“重復(fù)已保存分析步驟”功能,一鍵就能用同樣的方法分析其他數(shù)據(jù)。
Python如何用Jupyter來(lái)做數(shù)據(jù)分析
確實(shí)要比一行行編寫(xiě)代碼簡(jiǎn)單多了。

關(guān)于Python如何用Jupyter來(lái)做數(shù)據(jù)分析問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI