溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

大數(shù)據(jù)分析學(xué)習(xí)必須用到的工具,一定要收藏

發(fā)布時間:2020-07-08 04:13:13 來源:網(wǎng)絡(luò) 閱讀:371 作者:a大數(shù)據(jù) 欄目:大數(shù)據(jù)

簡單來說,我們可以把大數(shù)據(jù)分析工具簡單分成兩個維度:

第一維度:數(shù)據(jù)存儲層——數(shù)據(jù)報表層——數(shù)據(jù)分析層——數(shù)據(jù)展現(xiàn)層

第二維度:用戶級——部門級——企業(yè)級——BI級

1、數(shù)據(jù)存儲層

數(shù)據(jù)存儲涉及到數(shù)據(jù)庫的概念和數(shù)據(jù)庫語言,這方面不一定要深鉆研,但至少要理解數(shù)據(jù)的存儲方式、數(shù)據(jù)的基本結(jié)構(gòu)和數(shù)據(jù)類型。SQL查詢語言必不可少,精通最好。可從常用的select查詢,update修改,delete刪除,insert插入的基本結(jié)構(gòu)和讀取入手。

Access2003. Access07等 ,這是最基本的個人數(shù)據(jù)庫,經(jīng)常用于個人或部分基本的數(shù)據(jù)存儲;MySQL數(shù)據(jù)庫,這個對于部門]級或者互聯(lián)網(wǎng)的數(shù)據(jù)庫應(yīng)用是必要的,這個時候關(guān)鍵掌握數(shù)據(jù)庫的庫結(jié)構(gòu)和SQL語言的數(shù)據(jù)查詢能力;

SQL Server 2005或更高版本,對中小企業(yè), - -些大型企業(yè)也可以采用SQL Server數(shù)據(jù)庫,其實這個時候本身除了數(shù)據(jù)存儲,也包括了數(shù)據(jù)報表和數(shù)據(jù)分析了,甚至數(shù)據(jù)挖掘工具都在其中了;

DB2,Oracle數(shù)據(jù)庫都是大型數(shù)據(jù)庫了,主要是企業(yè)級,特別是大型企業(yè)或者對數(shù)據(jù)海量存儲需求的就是必須的了, 一般大型數(shù)據(jù)庫公司都提供非常好的數(shù)據(jù)整合應(yīng)用平臺;

BI級別,實際上這個不是數(shù)據(jù)庫,而是建立在前面數(shù)據(jù)庫基礎(chǔ)上的,企業(yè)級應(yīng)用的數(shù)據(jù)倉庫。DataWarehouse,建立在DW級上的數(shù)據(jù)存儲基本上都是商業(yè)智能平臺,整合了各種數(shù)據(jù)分析,報表、分析和展現(xiàn)! BI級別的數(shù)據(jù)倉庫結(jié)合BI產(chǎn)品也是近幾年的大趨勢。

.在入門學(xué)習(xí)大數(shù)據(jù)的過程當(dāng)中有遇見學(xué)習(xí),行業(yè),缺乏系統(tǒng)學(xué)習(xí)路線,系統(tǒng)學(xué)習(xí)規(guī)劃,歡迎你加入我的大數(shù)據(jù)學(xué)習(xí)交流裙:251956502 ,裙文件有我這幾年整理的大數(shù)據(jù)學(xué)習(xí)手冊,開發(fā)工具,PDF文檔書籍,你可以自行下載。

2、報表層

企業(yè)存儲了數(shù)據(jù)需要讀取,需要展現(xiàn),報表工具是最普遍應(yīng)用的工具,尤其是在國內(nèi)。傳統(tǒng)報表解決的是展現(xiàn)問題,目前國內(nèi)的帆軟報表FineReport已經(jīng)算在業(yè)內(nèi)做到頂尖,是帶著數(shù)據(jù)分析思想的報表,因其優(yōu)異的接口開放功能、填報、表單功能,能夠做到打通數(shù)據(jù)的進(jìn)出,涵蓋了早期商業(yè)智能的功能。

Tableau,同F(xiàn)ineBI一樣,可分在報表層也可分為數(shù)據(jù)展現(xiàn)層。FineBI和Tableau同屬于近年來非常棒的軟件,可作為可視化數(shù)據(jù)分析軟件,我常用FineBI從數(shù)據(jù)庫中進(jìn)行報表和可視化分析。相對而言,可視化Tableau更優(yōu),但FineBI又有另一種身份——商業(yè)智能,所以在大數(shù)據(jù)處理方面的能力更勝一籌。

3、數(shù)據(jù)分析層

這個層其實有很多分析工具,當(dāng)然我們最常用的就是Excel ,我經(jīng)常用的就是統(tǒng)計分析和數(shù)據(jù)挖掘工具;

Excel軟件,首先版本越高越好用這是肯定的;當(dāng)然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統(tǒng)計分析工作!但是我也常說,有能力把Excel玩成統(tǒng)計工具不如專門學(xué)會統(tǒng)計軟件;

SPSS軟件:當(dāng)前版本是18,名字也改成了PASW Statistics ;我從3.0開始Dos環(huán)境下編程分析,到現(xiàn)在版本的變遷也可以看出SPSS社會科學(xué)統(tǒng)計軟件包的變化,從重視醫(yī)學(xué)、化學(xué)等開始越來越重視商業(yè)分析,現(xiàn)在已經(jīng)成為了預(yù)測分析軟件;

SAS軟件: SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模塊平臺整合,相對來講,SAS比較難學(xué)些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設(shè)計等還是SAS比較好用,另外, SAS的學(xué)習(xí)材料比較多,也公開,會有收獲的!

JMP分析: SAS的一個分析分支

XLstat : Excel的插件,可以完成大部分SPSS統(tǒng)計分析功能

4、表現(xiàn)層

表現(xiàn)層也叫數(shù)據(jù)可視化,以上每種工具都幾乎提供了一點展現(xiàn)功能。FineBI和Tableau的可視化功能上文有提過。其實,近年來Excel的可視化越來越棒,配上一些插件,使用感更佳。

PPT:辦公常用,用來寫數(shù)據(jù)分析報告;

Xmind&百度腦圖:梳理流程,幫助思考分析,展現(xiàn)數(shù)據(jù)分析的層次;

Xcelsius軟件:Dashboard制作和數(shù)據(jù)可視化報表工具,可以直接讀取數(shù)據(jù)庫,在Excel里建模,互聯(lián)網(wǎng)展現(xiàn),最大特色還是可以在PPT中實現(xiàn)動態(tài)報表。

最后,需要說明的是,這樣的分類并不是區(qū)分軟件,只是想說明軟件的應(yīng)用。有時候我們把數(shù)據(jù)庫就用來進(jìn)行報表分析,有時候報表就是分析,有時候分析就是展現(xiàn);當(dāng)然有時候展現(xiàn)就是分析,分析也是報表,報表就是數(shù)據(jù)存儲了!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI