您好,登錄后才能下訂單哦!
這篇文章主要介紹基于Flink的MQ-Hive實時數(shù)據(jù)集成如何實現(xiàn)字節(jié)跳動,文中介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們一定要看完!
在數(shù)據(jù)中臺建設過程中,一個典型的數(shù)據(jù)集成場景是將 MQ (Message Queue,例如 Kafka、RocketMQ 等)的數(shù)據(jù)導入到 Hive 中,以供下游數(shù)倉建設以及指標統(tǒng)計。由于 MQ-Hive 是數(shù)倉建設第一層,因此對數(shù)據(jù)的準確性以及實時性要求比較高。
已有方案及痛點
字節(jié)跳動內已有解決方案如下圖所示,主要分了兩個步驟:
通過 Dump 服務將 MQ 的數(shù)據(jù)寫入到 HDFS 文件
再通過 Batch ETL 將 HDFS 數(shù)據(jù)導入到 Hive 中,并添加 Hive 分區(qū)
基于 Flink 實時解決方案
以上是“基于Flink的MQ-Hive實時數(shù)據(jù)集成如何實現(xiàn)字節(jié)跳動”這篇文章的所有內容,感謝各位的閱讀!希望分享的內容對大家有幫助,更多相關知識,歡迎關注億速云行業(yè)資訊頻道!
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。