您好,登錄后才能下訂單哦!
小編給大家分享一下presto、sparksql、druid、kylin、clickhouse是什么,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
相對于sparksql,presto是純內(nèi)存計算,盡量使用整個集群中的內(nèi)存,sparksql依賴于分配的executor數(shù)量,在executor內(nèi)存不足時會落盤;
相對于sparksql,presto啟動執(zhí)行更迅速,sparksql要依賴yarn調(diào)度資源;
相對于sparksql,presto帶有分頁功能,在分頁查詢時更有優(yōu)勢;
相對于presto,sparksql運行更穩(wěn)定,presto會經(jīng)常出現(xiàn)oom;
druid和kylin更適合預聚合場景,其中druid是時序數(shù)據(jù)庫,對所有維度列枚舉值建立bitmap索引,所以維度枚舉值如果較多的話,數(shù)據(jù)膨脹會比較厲害;kylin是通過MapReduce任務枚舉維度組合,每一種維度組合對應一張hbase表,維度組合值為主鍵,通過hbase rowkey實現(xiàn)快速訪問,因為實現(xiàn)要指定維度組合情況,所以kylin適合業(yè)務場景比較固定的情況,這也是hbase的特點,通過單一的key查詢數(shù)據(jù)。
clickhouse可以對數(shù)據(jù)分區(qū),建立主鍵,對命中主鍵的明細數(shù)據(jù)聚合查詢較快,這種對于一些維度枚舉值較多的數(shù)據(jù)比較適合,沒有數(shù)據(jù)膨脹
druid和kylin主要針對預聚合場景,因此查詢較快,qps較高,但是因為數(shù)據(jù)做了聚合,無法查看明細數(shù)據(jù),不支持join;clickhouse、presto、sparksql主要是掃描原始數(shù)據(jù),實時聚合,因此查詢較慢,qps較低,但是clickhouse有主鍵索引,數(shù)據(jù)都存在本地,因此查詢速度明顯快于presto和sparksql,但是presto、sparksql join性能更好
看完了這篇文章,相信你對“presto、sparksql、druid、kylin、clickhouse是什么”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。