溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)分析師怎么應(yīng)對(duì)數(shù)據(jù)庫(kù)取數(shù)后的離線分析

發(fā)布時(shí)間:2021-12-02 10:23:14 來(lái)源:億速云 閱讀:141 作者:iii 欄目:互聯(lián)網(wǎng)科技

本篇內(nèi)容主要講解“數(shù)據(jù)分析師怎么應(yīng)對(duì)數(shù)據(jù)庫(kù)取數(shù)后的離線分析”,感興趣的朋友不妨來(lái)看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來(lái)帶大家學(xué)習(xí)“數(shù)據(jù)分析師怎么應(yīng)對(duì)數(shù)據(jù)庫(kù)取數(shù)后的離線分析”吧!

因?yàn)槿狈糜霉ぞ叩闹С?,?shù)據(jù)分析人員的離線分析動(dòng)作總是先由一個(gè)事先寫(xiě)好的復(fù)雜查詢或經(jīng)多步驟處理后臨時(shí)表導(dǎo)出的數(shù)據(jù),之后在 Excel 中用 vlookup(),過(guò)濾器等來(lái)完成,當(dāng)數(shù)據(jù)更新或范圍擴(kuò)大后又要重新取數(shù),重新在 Excel 中操作。如果能有一個(gè)桌面工具每次會(huì)實(shí)時(shí)讀取單表數(shù)據(jù),既能完成上述復(fù)雜查詢和多步驟處理到臨時(shí)表的計(jì)算,又能取代在 Excel 中的計(jì)算動(dòng)作,免除重復(fù)勞動(dòng),將會(huì)是很多數(shù)據(jù)分析人員的福音。

如果你會(huì)寫(xiě) SQL 或 VBA,非常在意獲取數(shù)據(jù)后能夠靈活的多次計(jì)算,而不是想用一個(gè)圖形界面工具完成有限的計(jì)算,又不想花費(fèi)很多時(shí)間去學(xué)習(xí) Python,集算器或許是一個(gè)不錯(cuò)的選擇。

比如,數(shù)據(jù)庫(kù)里有以下 3 張表:

SQL Query 1 result: (T1)

Col1 Col2 
A    1
B    2

Query 2 result: (T2)

Col3 Col4 
1    #
2    *

Query 3 result: (T3)

Col5   
1     
3

需要對(duì)上面 T1,T2,T3 三張表,完成類似下面 SQL 的關(guān)聯(lián)操作:

Select T1.col1,T2.col4 
        from T1,T2 
        where T1.col2=T2.col3 
        and T1.col2 in (Select T3.col5 from T3)

結(jié)果是:

Col1  Col4
A    #

如果數(shù)據(jù)量不大,直接內(nèi)存計(jì)算,集算器 SPL 代碼如下:

T1=DB.query("select Col1,Col2 from T1")
T2=DB.query("select Col3,Col4 from T2")
T3=DB.query("select Col5 from T3")
Result=T1.join@i(Col2,T2:Col3,Col1,Col4).select(T3.(Col5).contain(Col2)).new(Col1,Col4)

T1,T2,T3 也可以分別來(lái)自不同的數(shù)據(jù)庫(kù)或者數(shù)據(jù)文件

如果數(shù)據(jù)量比較大,可以用集算器的游標(biāo),和數(shù)據(jù)庫(kù)游標(biāo)類似,代碼如下:

CS1=DB.cursor("select Col1,Col2 from T1 orderby Col2")
CS2=DB.cursor("select Col3,Col4 from T2 orderby Col3")
S3=DB.query@i("select Col5 from T3")
Result=joinx(CS1,Col2;CS2,Col3).select(S3.contain(#1.Col2)).new(#1.Col1,#2.Col4).fetch()

如果想利用最終計(jì)算后的結(jié)果在 Excel 中做圖表,導(dǎo)出到 Excel 也很方便

file("Result.xlsx").xlsexport(Result)

集算器即裝即用,應(yīng)對(duì)上述問(wèn)題非常得心應(yīng)手。集算器也支持先將大數(shù)據(jù)保存成本地文件,然后讀取這些類型已確定、已壓縮的數(shù)據(jù)做高效計(jì)算,這樣可以減輕數(shù)據(jù)庫(kù)的負(fù)載,也能讓本地計(jì)算效率更高。

到此,相信大家對(duì)“數(shù)據(jù)分析師怎么應(yīng)對(duì)數(shù)據(jù)庫(kù)取數(shù)后的離線分析”有了更深的了解,不妨來(lái)實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI