溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

報(bào)表連hive時(shí)數(shù)據(jù)量比較大如何分頁查詢

發(fā)布時(shí)間:2021-12-16 14:20:27 來源:億速云 閱讀:200 作者:小新 欄目:大數(shù)據(jù)

小編給大家分享一下報(bào)表連hive時(shí)數(shù)據(jù)量比較大如何分頁查詢,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

Hive 提供了類似 Oracle 的 rownum 機(jī)制,類似這樣(效率比較差):

select * from (select row_number() over (order by create_time desc) as rownum,u.* from user u) mm where mm.rownum between 10 and 15;

還有一種辦法,如果表里有唯一標(biāo)識(shí)字段也可以借助這個(gè)字段和 limit 實(shí)現(xiàn)。比如:
獲取第一頁數(shù)據(jù):
注:同時(shí)需要記錄這 10 條中最大的 id 為 preId,作為下一頁的條件。

select * from table order by id asc limit 10;

獲取第二頁數(shù)據(jù):
注:同時(shí)保存數(shù)據(jù)中最大的 id 替換 preId。

select * from table where id >preId order by id asc limit 10;

對于數(shù)據(jù)庫分頁, 這里曾經(jīng)分析過存在的問題 大清單報(bào)表應(yīng)當(dāng)怎么做? 也給出了改善的思路,可以參考:
把取數(shù)和呈現(xiàn)做現(xiàn)兩個(gè)異步線程,取數(shù)線程發(fā)出 SQL 后就不斷取出數(shù)據(jù)后緩存到本地存儲(chǔ)中,呈現(xiàn)線程根據(jù)頁數(shù)計(jì)算出行數(shù)到本地緩存中去獲取數(shù)據(jù)顯示。這樣,只要已經(jīng)取過的數(shù)據(jù)就能快速呈現(xiàn),不會(huì)有等待感,還沒取到的數(shù)據(jù)需要等待一下也是正??衫斫獾?;而取數(shù)線程只涉及一句 SQL,在數(shù)據(jù)庫中是同一個(gè)事務(wù),也不會(huì)有不一致的問題。這樣,兩個(gè)問題都能得到解決。不過這需要設(shè)計(jì)一種可以按行號隨機(jī)訪問記錄的存儲(chǔ)格式,不然要靠遍歷把記錄數(shù)出來,那反應(yīng)仍然會(huì)很遲鈍。

畫個(gè)圖感受感受:

報(bào)表連hive時(shí)數(shù)據(jù)量比較大如何分頁查詢
②和③分別是兩個(gè)線程,一個(gè)負(fù)責(zé)取數(shù)緩存,一個(gè)負(fù)責(zé)讀緩存做報(bào)表呈現(xiàn)

看起來有點(diǎn)復(fù)雜,可直接用做好的工具: 海量清單與分組報(bào)表的實(shí)現(xiàn)
還能導(dǎo)出 Excel,也能打印。

看完了這篇文章,相信你對“報(bào)表連hive時(shí)數(shù)據(jù)量比較大如何分頁查詢”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI