溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

性能優(yōu)化技巧 - 內(nèi)存關聯(lián)計算

發(fā)布時間:2020-07-08 02:48:22 來源:網(wǎng)絡 閱讀:192 作者:raqsoft 欄目:大數(shù)據(jù)

關聯(lián)動作會嚴重影響性能,SPL支持內(nèi)存預關聯(lián),可以加快關聯(lián)動作,從而提升性能。

為了理解關聯(lián)動作對性能的影響,下面設計一套Oracle關聯(lián)表,以及無關聯(lián)的寬表,并執(zhí)行同樣的計算。

關聯(lián)表的結構和關系如下:

                                              性能優(yōu)化技巧 - 內(nèi)存關聯(lián)計算

數(shù)據(jù)量:通話記錄表(百萬條)、用戶表(十萬條)、開戶網(wǎng)點(一萬條),代理商表(一萬條)。

計算目標:求通訊總成本,即所有呼出用戶和呼入用戶分別對應的網(wǎng)點均攤成本、代理商均攤成本之和。

將關聯(lián)結果寫入另一張表,形成無關聯(lián)的寬表:

callRecordWide
SERIALNUMBER
CHARGE
OUTBRANCHOUTCOST
INBRANCHINCOST
OUTAGENTOUTCOST
INAGENTINCOST

下面的SPL腳本,用來說明關聯(lián)動作對性能的影響:


AB
1=connect("orcl")
2=now()
3for 10=A1.query("select   sum(outBranch.outCost+inBranch.inCost+outAgent.outCost+inAgent.inCost)  from callRecord,callUser outUser,callUser   inUser,telecomBranch outBranch,telecomBranch inBranch,telecomAgent   outAgent,telecomAgent inAgent where callRecord.outID=outUser.userID and  callRecord.inID=inUser.userID and   outUser.branchID=outBranch.branchID and outUser.agentID=outAgent.agentID and   inUser.branchID=inBranch.branchID and inUser.agentID=inAgent.agentID")
4=interval@ms(A2,now())/Oracle關聯(lián)表25802ms
5

6=now()
7for 10=A1.query("select   sum(outBranchOutCost+inBranchInCost+outAgentOutCost+inAgentInCost) from   callRecordWide")
8=interval@ms(A6,now())/oracle寬表2055ms
9=A1.close()

可以看到,關聯(lián)比無關聯(lián)慢12.6倍(25802/2055),會嚴重影響計算性能。

      

SPL可以通過預關聯(lián)來提升關聯(lián)動作的性能。首先加載數(shù)據(jù)到內(nèi)存,代碼如下:


AB
1=connect("orcl")
2=A1.query("select * from   telecomAgent").keys(AGENTID)
3=A1.query("select * from   telecomBranch").keys(BRANCHID)
4=A1.query("select * from   callUser").keys(USERID)
5=A1.query("select * from   callRecord").keys(SERIALNUMBER)
6=A1.switch(AGENTID,A2:AGENTID; BRANCHID,A3:BRANCHID)
7=A5.switch(OUTID,A14:USERID; INID,A4:USERID)
8=env(callRecord,A7)/全局變量:預關聯(lián)

函數(shù)switch可將字段值替換為記錄引用,從而實現(xiàn)預關聯(lián)。

后續(xù)業(yè)務算法中,可以直接引用其他表的字段,從而提升關聯(lián)計算的性能,如下:

=callRecord.sum(OUTID.BRANCHID.OUTCOST+INID.BRANCHID.INCOST

+OUTID.AGENTID.OUTCOST+INID.AGENTID.INCOST)

 

為了直觀理解預關聯(lián)對計算性能的提升,下面同樣用SPL預關聯(lián)和寬表做比較。


AB
11=connect("orcl")
12=A11.query("select * from   telecomAgent").keys(AGENTID)
13=A11.query("select * from   telecomBranch").keys(BRANCHID)
14=A11.query("select * from   callUser").keys(USERID)
15=A11.query("select * from   callRecord").keys(SERIALNUMBER)
16=A14.switch(AGENTID,A12:AGENTID;   BRANCHID,A13:BRANCHID)
17=A15.switch(OUTID,A14:USERID;   INID,A14:USERID)
18=env(callRecord,A17)/全局變量:預關聯(lián)
19=A11.query@s("select * from   callRecordWide").keys(SERIALNUMBER)
20=env(callRecordWide,A19)/全局變量:寬表
21

22=now()
23for 10

=callRecord.sum(OUTID.BRANCHID.OUTCOST

+INID.BRANCHID.INCOST

+OUTID.AGENTID.OUTCOST+INID.AGENTID.INCOST)

24=interval@ms(A22,now())/SPL預關聯(lián)13272ms
25

26=now()
27for 10

=callRecordWide.sum(OUTBRANCHOUTCOST

+INBRANCHINCOST+OUTAGENTOUTCOST

+INAGENTINCOST)

28=interval@ms(A26,now())/SPL寬表2210ms

可以看到,預關聯(lián)比寬表慢6倍(13272/2210),相對于關聯(lián)表比寬表慢的12.6倍,已經(jīng)有較大幅度的提升。在寬表時,SPL計算性能和ORACLE幾乎相同(2210:2055),但在有關聯(lián)時,預關聯(lián)的SPL計算速度已經(jīng)明顯超出臨時關聯(lián)的ORACLE了(13272:25802)。

需要注意的是,上述算法雖然使用了寬表做對比,但并不是說寬表可以代替關聯(lián)表。事實上,寬表會浪費大量空間,還會造成創(chuàng)建、同步等維護困難,實際項目中很少用到。而預關聯(lián)使用引用來建立關聯(lián),不會創(chuàng)造新表,不會浪費空間,不需要同步數(shù)據(jù)。


向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI