溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)挖掘工程師如何選擇數(shù)據(jù)可視化工具?

發(fā)布時(shí)間:2020-06-13 10:06:56 來(lái)源:網(wǎng)絡(luò) 閱讀:1308 作者:huangbo929 欄目:網(wǎng)絡(luò)安全

如何選擇數(shù)據(jù)可視化工具?

如何選用數(shù)據(jù)可視化工具?在回答這個(gè)問題之前現(xiàn)需要回答另外一個(gè)問題,你需要用這些數(shù)據(jù)可視化工具來(lái)做什么,實(shí)現(xiàn)什么目的。

也許你有一個(gè)完整的想法,已經(jīng)通過(guò)驗(yàn)證了,需要用更直觀易懂的方式來(lái)展現(xiàn),從而講述一個(gè)邏輯或者是一個(gè)故事;也許你是有大量的數(shù)據(jù),你想怎么從這些數(shù)據(jù)中間發(fā)現(xiàn),挖掘,并展現(xiàn)一些數(shù)據(jù)背后的知識(shí)或者洞察;也許你是有各種各樣的數(shù)據(jù),但是你不懂?dāng)?shù)據(jù)建模,編程,或者數(shù)據(jù)清洗,甚至是SQL的優(yōu)化等你需要一個(gè)易用的數(shù)據(jù)可視化工具實(shí)現(xiàn)通過(guò)拖拽就能完成數(shù)據(jù)的可視化,并且可以給出最合適的展示圖形;也許還有其他的各種場(chǎng)景,但是所有數(shù)據(jù)可視化工具都有他核心服務(wù)的一個(gè)場(chǎng)景,漂亮,易用,簡(jiǎn)單,協(xié)作,智能等等。每一個(gè)數(shù)據(jù)可視化工具都有一個(gè)定位的標(biāo)簽。應(yīng)該通過(guò)我們需要的核心需求來(lái)做選擇。做一個(gè)簡(jiǎn)單分類:

1. 明確目標(biāo)的易用,多樣展示型工具,比如Tableau;

2. 可以支持靈活定制的展示型,比如圖標(biāo)庫(kù)D3;

3. 不明確目標(biāo)的數(shù)據(jù)探索型,比如google spreadsheet的explore;

4. 有行業(yè)訴求既能可視化分析又能數(shù)據(jù)探索的,比如帆軟FineBI;

5. 按照行業(yè)或者職能需求的數(shù)據(jù)可視化,比如DOMO,Qlikview;

之前看到某網(wǎng)友用了24種工具制作一個(gè)相同的圖表,比較了12款可視化軟件和12個(gè)編程/圖表庫(kù),并針對(duì)工具/圖表庫(kù)的側(cè)重度,靈活程度,圖表創(chuàng)新性,交互效果四大方面,寫了一篇一級(jí)棒的文章。

今年5月,這個(gè)妹子給自己設(shè)置了一個(gè)挑戰(zhàn):盡可能嘗試使用多種多樣的編程語(yǔ)言或者軟件來(lái)進(jìn)行數(shù)據(jù)可視化。為了比較這些工具,她利用這些工具重復(fù)制作了同樣的一張散點(diǎn)圖?;诮Y(jié)果,她還發(fā)布了兩篇文章:一篇是用12種軟件做一個(gè)相同的圖表,另一篇是用12種編程/圖表庫(kù)做一個(gè)相同的圖表。下圖展示了她使用12個(gè)不同的軟件制作同一張散點(diǎn)圖的過(guò)程:

數(shù)據(jù)挖掘工程師如何選擇數(shù)據(jù)可視化工具?

這是12種編程/圖表庫(kù)制作出來(lái)的效果:

數(shù)據(jù)挖掘工程師如何選擇數(shù)據(jù)可視化工具?

她從這些可視化軟件/圖表庫(kù)中認(rèn)識(shí)到:沒有十全十美的工具,但是如果確立(可視化)目標(biāo),就能找到合適的工具去實(shí)現(xiàn)。下面是她在制作中曾遇到過(guò)的一些矛盾,也是數(shù)據(jù)可視化工作者常常遇到的情況。

1、分析 VS 展示:

是想使用工具(R, Python)來(lái)分析數(shù)據(jù),還是更注重于構(gòu)建可視化效果(D3.js, Illustrator)?有些BI工具(比如說(shuō)FineBI, Tableau, Plotly)試圖在這其中謀求平衡,既可分析又可展示。她根據(jù)分析和展示上的側(cè)重性對(duì)可視化工具和編程語(yǔ)言們進(jìn)行了排列:可以看到工具類的往往更注重展示,而編程類的比較平均,各有側(cè)重。

數(shù)據(jù)挖掘工程師如何選擇數(shù)據(jù)可視化工具?

2、數(shù)據(jù)管理

如果制作可視化的時(shí)候需要更改源數(shù)據(jù)怎么辦?在這方面,這些工具或編程語(yǔ)言的靈活性如何?

低靈活性:比如在Illustrator中,即使你只是輕微修改了數(shù)據(jù),也需要重頭開始制作圖表,這種工具還不方便進(jìn)行數(shù)據(jù)管理。

中靈活性:比如在D3.js中,可以單獨(dú)處理或修改數(shù)據(jù),然后再重新導(dǎo)入數(shù)據(jù)文件來(lái)更新可視化結(jié)果。

高靈活性:比如在FineBI中,數(shù)據(jù)分析的處理如數(shù)據(jù)建模,數(shù)據(jù)清洗,甚至是SQL的優(yōu)化,大數(shù)據(jù)量的處理都可以在一個(gè)平臺(tái)完成,同時(shí)易用,拖拽就能完成數(shù)據(jù)的可視化。

數(shù)據(jù)挖掘工程師如何選擇數(shù)據(jù)可視化工具?

3、傳統(tǒng)圖表 VS 創(chuàng)新圖表:

如果你只需要基本的圖表類型,如柱狀圖或折線圖,Excel完全可以滿足啦~但你如果想創(chuàng)建表現(xiàn)形式更為豐富的互動(dòng)圖表,比如點(diǎn)擊可以出現(xiàn)酷炫的交互效果,像D3.js之類的編程語(yǔ)言就更適合啦,但是學(xué)習(xí)此類工具的門檻也往往更高,有著陡峭的學(xué)習(xí)曲線和冗長(zhǎng)的代碼?;蛘咭部梢允褂肞rocessing,用它制作這張散點(diǎn)圖的代碼長(zhǎng)度只有D3.js的一半。還有Lyra,它不需要任何代碼基礎(chǔ),但也可以讓你輕松修改數(shù)據(jù)有關(guān)的視覺元素。

4、交互圖表 VS 靜態(tài)圖表:

你是需要?jiǎng)?chuàng)造基于網(wǎng)頁(yè)的交互圖表(如D3.js, Highcharts能做到的),還是PDF/SVG/PNG形態(tài)的圖表就能滿足你 (R和Illustrator可以做到)?幾年前,互動(dòng)圖表曾受到高度追捧,但現(xiàn)在關(guān)注焦點(diǎn)慢慢從“看起來(lái)怎么樣”轉(zhuǎn)移到“什么才更有意義”。對(duì)于分析部分,交互特性往往也是很有必要存在的。Plotly和R的庫(kù)Ggvis就可以讓讀者輕松地將鼠標(biāo)懸停在可視元素上來(lái)查看基礎(chǔ)數(shù)據(jù)。下圖是作者對(duì)于軟件/編程的在靜態(tài)和交互的劃分:

數(shù)據(jù)挖掘工程師如何選擇數(shù)據(jù)可視化工具?


向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI