溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何分析數(shù)據(jù)可視化

發(fā)布時(shí)間:2022-01-15 11:22:42 來(lái)源:億速云 閱讀:140 作者:柒染 欄目:大數(shù)據(jù)

本篇文章為大家展示了如何分析數(shù)據(jù)可視化,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

我們現(xiàn)在生活的每一秒都在產(chǎn)生著數(shù)據(jù),比如你現(xiàn)在看這篇文章的時(shí)候。用的什么手機(jī),型號(hào),你所在地點(diǎn),點(diǎn)開(kāi)這篇文章的時(shí)間,花了多久看的文章……都是被收集的數(shù)據(jù)。

當(dāng)同類(lèi)的數(shù)據(jù)集合在一起,甚至于縱向的其他數(shù)據(jù)展開(kāi)聯(lián)系時(shí),都可以成為大數(shù)據(jù)。取決于是誰(shuí)用這些數(shù)據(jù),以及使用目的,大數(shù)據(jù)沒(méi)有嚴(yán)格意義上的類(lèi)型界定。但是當(dāng)你有了龐大的數(shù)據(jù)后,如何最直接的反應(yīng)數(shù)據(jù)情況?如何以最快的速度發(fā)現(xiàn)需要進(jìn)一步分析的數(shù)據(jù)?做了一系列分析得出結(jié)果后,如何如何簡(jiǎn)單快速的說(shuō)服你的讀者或者領(lǐng)導(dǎo)?

我們本身可能就是大數(shù)據(jù)的生產(chǎn)者。也會(huì)是使用者。

什么是數(shù)據(jù)可視化?

其實(shí)大數(shù)據(jù)是一個(gè)很空洞的概念,具體的意義針對(duì)不同的人有不同的含義。大數(shù)據(jù)的基本流程鏈包括:數(shù)據(jù)挖掘,數(shù)據(jù)清理,數(shù)據(jù)存儲(chǔ),數(shù)據(jù)分析,數(shù)據(jù)展示。

數(shù)據(jù)可視化就是這樣一種,貫穿數(shù)據(jù)分析整個(gè)時(shí)期,在前期助數(shù)據(jù)分析人員通過(guò)迅速呈現(xiàn)整體數(shù)據(jù),發(fā)現(xiàn)可能的問(wèn)題點(diǎn),后期通過(guò)可視化,后期將數(shù)據(jù)分析結(jié)果更快速的呈現(xiàn)在讀者面前。數(shù)據(jù)可視化可以通過(guò)使用圖形、圖標(biāo)、色彩變化等各種組合對(duì)數(shù)據(jù)進(jìn)行解讀,從而使人們快速理解一組或多組數(shù)據(jù)中的復(fù)雜關(guān)系。通過(guò)數(shù)據(jù)可視化,人們可以從中辨別出趨勢(shì),固定模式,發(fā)現(xiàn)特定問(wèn)題,甚至可以為決策提供依據(jù)。

拿最近新冠的例子來(lái)說(shuō),你一定很熟悉下面的這些圖了:

如何分析數(shù)據(jù)可視化
全國(guó)新增新冠確診人數(shù)(圖片來(lái)源:丁香園)
如何分析數(shù)據(jù)可視化
全國(guó)現(xiàn)存累計(jì)確診人數(shù)分布(圖片來(lái)源:丁香園)
如何分析數(shù)據(jù)可視化
國(guó)內(nèi)新增確診數(shù)據(jù)(圖片來(lái)源:丁香園)

第一第二張圖就是數(shù)據(jù)可視化的例子。折線圖和地圖很直觀的將第三張圖的新冠肺炎每日新增人數(shù),以及分布,很直觀的用圖像表現(xiàn)出來(lái),而省去讀者對(duì)第三張圖標(biāo)具體數(shù)字的解讀和處理。當(dāng)讀者需要進(jìn)一步了解圖形背后的具體數(shù)字時(shí),讀者可以去第三張圖標(biāo)進(jìn)行研讀。而這僅僅是最簡(jiǎn)單的例子。

我們?yōu)槭裁葱枰獢?shù)據(jù)可視化?

通過(guò)上面的例子,如果說(shuō)大數(shù)據(jù)可以幫助我們找到規(guī)律和趨勢(shì),那數(shù)據(jù)可視化是一種將數(shù)據(jù)直觀呈現(xiàn)出來(lái)的方式。數(shù)據(jù)可視化貫穿數(shù)據(jù)清理,數(shù)據(jù)整合的一個(gè)步驟。比如說(shuō)你是一名銷(xiāo)售人員要向上一級(jí)匯報(bào)銷(xiāo)售成果。你涉及的數(shù)據(jù)可能包括客戶姓名,客戶地址,購(gòu)買(mǎi)產(chǎn)品,購(gòu)買(mǎi)型號(hào),購(gòu)買(mǎi)數(shù)量,購(gòu)買(mǎi)日期,購(gòu)買(mǎi)單號(hào),發(fā)貨時(shí)間,發(fā)貨方式,銷(xiāo)售金額,折扣數(shù)目,利潤(rùn)率……你應(yīng)該從何種角度下手處理你的數(shù)據(jù),你得出需要加強(qiáng)某個(gè)產(chǎn)品的宣傳的結(jié)論時(shí),覺(jué)得你的領(lǐng)導(dǎo)是更愿意直觀的了解到結(jié)果,還是愿意花15分鐘一頁(yè)一頁(yè)研讀你的分析?

如何分析數(shù)據(jù)可視化

美國(guó)民眾對(duì)新冠病毒看法的變化,用圖像的形式比用電子表格或者文字的形式,更加具體直接。(圖源:538)

所以數(shù)據(jù)可視化可以簡(jiǎn)化人腦處理信息,并得到結(jié)論的一種有效手段。我們?nèi)四X更容易通過(guò)圖像等視覺(jué)上的呈現(xiàn)來(lái)得出一定的結(jié)論。就算一些分析人員可以通過(guò)復(fù)雜的演算,模型設(shè)計(jì)得出某些結(jié)論,但這些結(jié)論遠(yuǎn)遠(yuǎn)沒(méi)有比直接用圖形來(lái)總結(jié)來(lái)的更直觀。

拿個(gè)最簡(jiǎn)單的例子來(lái)說(shuō),北京上海的地鐵公交圖就可以稱為一種數(shù)據(jù)可視化。縱橫交錯(cuò)的軌道交通,不同的線路站點(diǎn),相交的換乘點(diǎn),如果通過(guò)文字或者表格來(lái)呈現(xiàn)遠(yuǎn)遠(yuǎn)不及軌交地圖來(lái)的直觀明了

如何分析數(shù)據(jù)可視化
上海軌交地圖(圖片來(lái)源:TravelChinaGuide)

既然連軌交地圖都是數(shù)據(jù)可視化的一種,那你可以放開(kāi)了聯(lián)想,其實(shí)生活中很多方面,我們都涉及數(shù)據(jù)可視化。

數(shù)據(jù)可視化和數(shù)據(jù)分析有什么區(qū)別?

數(shù)據(jù)可視化很容易和數(shù)據(jù)分析相混淆,誠(chéng)然兩者有相似之處——數(shù)據(jù)可視化和數(shù)據(jù)分析都是在可視界面中展示數(shù)據(jù)。

如何分析數(shù)據(jù)可視化

多組可視化合在一起時(shí),可以展示更多的信息甚至可以講述一個(gè)完整時(shí)間(圖源:Center for Data Innovation)

是兩者還有很多方面有不同。數(shù)據(jù)分析是一個(gè)探索性的過(guò)程。因?yàn)楹芏鄶?shù)據(jù)分析人員拿到數(shù)據(jù)后,通常有一個(gè)特定問(wèn)題需要去發(fā)現(xiàn),圍繞著這個(gè)問(wèn)題,要進(jìn)行不同測(cè)試,需要足夠的耐心才能發(fā)現(xiàn)使用某個(gè)手段,集中分析某些數(shù)據(jù),才能體現(xiàn)出某些關(guān)系,并且回答最初的問(wèn)題。而數(shù)據(jù)可視化是數(shù)據(jù)分析中的一部分,前期后期都可以通過(guò)數(shù)據(jù)可視化,做到更有效的數(shù)據(jù)分析,以及更清楚的呈現(xiàn)最終分析結(jié)果。大致概括如下:

使用目的不同。數(shù)據(jù)分析可以發(fā)現(xiàn)某些潛在的模型,或者趨勢(shì),可以幫助預(yù)測(cè)某些將來(lái)發(fā)生的事件。數(shù)據(jù)分析所使用的前期或后期的數(shù)據(jù),可以作為數(shù)據(jù)可視化的數(shù)據(jù)源。而數(shù)據(jù)可視化能夠更直觀的呈現(xiàn)某一局部特征,更明確的展現(xiàn)出某個(gè)變量的影響,前期是幫助數(shù)據(jù)分析人員了解大體數(shù)據(jù)情況,發(fā)現(xiàn)異常值。后期通過(guò)可是后分析的數(shù)據(jù),更好的展現(xiàn)分析結(jié)果。

兩者之間關(guān)系不同。數(shù)據(jù)分析是將分析和可視化相結(jié)合,去找出某些結(jié)論。有時(shí)候,數(shù)據(jù)分析是數(shù)據(jù)可視化的前端,數(shù)據(jù)可視化呈現(xiàn)的就是數(shù)據(jù)分析的結(jié)果。

使用工具不同。數(shù)據(jù)分析一般通過(guò)規(guī)范分析(prescriptive analytics)和預(yù)測(cè)分析(predictive  analytics),診斷分析(diagnostic analytics)。數(shù)據(jù)分析所使用的工具有Excel ,hive, Ploybase,SAP  Business Intelligence,Presto, Trifacta,Clear  Analytics,等等。而數(shù)據(jù)可視化可以是靜態(tài)展示也可以是互動(dòng)展示數(shù)據(jù),所使用的工具有:Plotly,DataHero,Tableau,QlikView,ZingCHhart  等等

如何分析數(shù)據(jù)可視化
Tableau的互動(dòng)式可是數(shù)據(jù)化。(圖源:TABLEAU)
數(shù)據(jù)可視化能夠如何幫助數(shù)據(jù)分析,并達(dá)到哪些目的?

數(shù)據(jù)可視化有很多用途,每種類(lèi)型的數(shù)據(jù)可視化可以有不同的用途。這里就說(shuō)一下數(shù)據(jù)可視化的最常見(jiàn)的情況。

  • 時(shí)間變化。使用時(shí)間變化展現(xiàn)另一個(gè)變量的變化的形式是最基本和最常見(jiàn)的方法。但是請(qǐng)注意,這并不代表這樣的可視化沒(méi)有價(jià)值。這種類(lèi)型的數(shù)據(jù)可視化之所以常見(jiàn),是因?yàn)榇蠖鄶?shù)的數(shù)據(jù)都涉及到時(shí)間因素。因此,許多數(shù)據(jù)分析的第一步就是查看數(shù)據(jù)是如何隨著時(shí)間變化而變化的。

  • 確定頻率。確定頻率也是數(shù)據(jù)可視化的基本用途之一。因?yàn)樗策m用于設(shè)計(jì)涉及時(shí)間的數(shù)據(jù)。如果涉及時(shí)間的話,除了檢查數(shù)據(jù)如何隨時(shí)間變化,還要查看在某一單位時(shí)間內(nèi),相關(guān)事件隨時(shí)間發(fā)生的頻率是否合乎邏輯。

  • 確定數(shù)據(jù)之間的關(guān)系(關(guān)聯(lián))。識(shí)別數(shù)據(jù)之間的關(guān)聯(lián)是數(shù)據(jù)可視化非常有價(jià)值的用途之一。了解數(shù)據(jù)中的關(guān)系非常重要,但是如果沒(méi)有可視化,就很難確定兩個(gè)變量之間的關(guān)系了。

  • 檢查整個(gè)數(shù)據(jù)。在市場(chǎng)研究中,經(jīng)??梢允褂脭?shù)據(jù)可視化檢查數(shù)據(jù)整體的例子。因?yàn)槭袌?chǎng)和銷(xiāo)售人員需要知道他們的消息針對(duì)于何種群體,因此他們需要分析整個(gè)市場(chǎng)的受眾群體,以及群體中的集群與集群之間的關(guān)聯(lián),集群中有影響力的人以及異常值。

  • 時(shí)間規(guī)劃。在做一項(xiàng)非常復(fù)雜的項(xiàng)目或者計(jì)劃表的時(shí)候,通常涉及不同部門(mén),不同人員,不同項(xiàng)目細(xì)節(jié),會(huì)讓人非常困惑。甘特圖(Gantt Chart)  可以通過(guò)清楚說(shuō)明項(xiàng)目中的每個(gè)任務(wù),以及所需完成的時(shí)間來(lái)解決這個(gè)問(wèn)題。

  • 分析價(jià)值和確定風(fēng)險(xiǎn)。由于分析價(jià)值和風(fēng)險(xiǎn)這類(lèi)指標(biāo)有很多相關(guān)因素,要考慮很多不同的變量,那么使用各種變量的普通電子表格,很難準(zhǔn)確有效的一眼將價(jià)值和風(fēng)險(xiǎn)看出。數(shù)據(jù)可視化可以像對(duì)公式進(jìn)行顏色編碼一樣,以顯示哪些機(jī)會(huì)有價(jià)值,哪些機(jī)會(huì)有風(fēng)險(xiǎn)。 

如何分析數(shù)據(jù)可視化
四種基本的數(shù)據(jù)可視化圖形(圖源:The Coding Room)

數(shù)據(jù)可視化有哪些類(lèi)型?

可視化圖類(lèi)型有多種多樣,這里我列舉了大多數(shù)市面上能見(jiàn)到的可視化類(lèi)型圖。

折線圖 (Line chart)

如何分析數(shù)據(jù)可視化
折線圖(圖源:New Zealand Census)

面積圖 (Area chart)

如何分析數(shù)據(jù)可視化
面積圖(圖源:Wikepedia)

條形圖(Bar chart)

如何分析數(shù)據(jù)可視化
條形圖(圖源:Naomi Robbins|Forbes)

直方圖(Histogram)

如何分析數(shù)據(jù)可視化
直方圖(圖源:Naomi Robbins|Forbes)

值得注意的是條形圖和直方圖是有區(qū)別的。條形圖的寬度表示類(lèi)別且固定,長(zhǎng)度表示頻數(shù)。直方圖用“面積”表示各組頻數(shù),舉行高度表示每一組的頻數(shù),寬度表示組距,因此高度與寬度均有意義。直方圖為X軸為連續(xù)數(shù)列,且連續(xù)排列。條形圖X軸為分類(lèi)數(shù)據(jù),分開(kāi)排列。

散點(diǎn)圖(Scatterplot)

如何分析數(shù)據(jù)可視化
散點(diǎn)圖(圖源:Wikimedia)

箱型圖(Box Plot)

如何分析數(shù)據(jù)可視化
箱型圖(圖源:Wikimedia)

氣泡圖(bubble chart)

如何分析數(shù)據(jù)可視化
氣泡圖(圖源:Tony Hirst | Flickr)

餅圖(Pie chart)

如何分析數(shù)據(jù)可視化
餅圖(圖源:Wikimedia)

量規(guī)圖(gauge)

如何分析數(shù)據(jù)可視化
量規(guī)圖(圖源Ken Flerlage | The FlerlageTwins)

地圖(Maps)

如何分析數(shù)據(jù)可視化
地圖

此處特別推薦哈佛大學(xué)地理分析中心(Center for Geographic Analysis - Harvard University)

  • https://gis.harvard.edu/researchhttp://worldmap.harvard.edu/africamap/

以及哈佛大學(xué)做的非洲地圖:

  • http://worldmap.harvard.edu/africamap/ 這張互動(dòng)地圖包括了經(jīng)濟(jì),宗教,社會(huì),人口,歷史,交通等方方面面。

熱圖(Heat map)

這就有很多種了。這里就放一個(gè)我曾使用過(guò)的眼動(dòng)儀(eye tracking)所產(chǎn)生的熱圖

如何分析數(shù)據(jù)可視化
眼動(dòng)儀其中的熱圖功能(圖源:Rosenfeld Media | Flickr

框架圖(Frame diagram)

如何分析數(shù)據(jù)可視化
通常框架圖指的是樹(shù)圖(圖源:Wikimedia)

瀑布圖 (Waterfall chart)

如何分析數(shù)據(jù)可視化
瀑布圖(圖源:Wikipedia)

漏斗圖(Funnel chart)

如何分析數(shù)據(jù)可視化
使用R創(chuàng)建的漏斗圖(圖源:Neha Kuma | Sisense)

雷達(dá)圖或蜘蛛圖(Radar or Spider Chart)

如何分析數(shù)據(jù)可視化
雷達(dá)圖(圖源:middlebury.edu)

這些就是市面上你可以見(jiàn)到的數(shù)據(jù)可視化圖形。當(dāng)然還有其它形式的,以及圖形與圖形之間的疊加組合,比如折線圖與直方圖的組合等等,我就不一一列舉了。

因此數(shù)據(jù)可視化并非那么神秘,我們常用的EXCEL就可以做出上述可視化圖形中的好幾種。除了Excel,Tableau可以創(chuàng)建其中絕大部分的數(shù)據(jù)可視化,而且通過(guò)使用其中的Dashboard可以創(chuàng)建互動(dòng)式的數(shù)據(jù)可視化,story功能實(shí)現(xiàn)圖組創(chuàng)建故事講述功能。最最重要的是Tableau提供免費(fèi)版本,使用Tableau的一切功能。免費(fèi)版本和付費(fèi)版本的區(qū)別在于保存,付費(fèi)版本可以保存在本地,而免費(fèi)版本可以上傳到Tableau的公共資源網(wǎng)上,和別人分享你所創(chuàng)建的數(shù)據(jù)可視化,同時(shí)還能查看別人創(chuàng)建的各種出色的可視化。

上述內(nèi)容就是如何分析數(shù)據(jù)可視化,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI