您好,登錄后才能下訂單哦!
本篇內(nèi)容介紹了“Hive的特點(diǎn)是什么”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會(huì)遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
Hive是構(gòu)建在hadoop上的數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,也急速hi數(shù)據(jù)提取轉(zhuǎn)化加載(ETL),并提供簡單的SQL查詢功能,稱為HQL(這邊要和Hibernate區(qū)別一下),允許熟悉SQL的用戶查詢數(shù)據(jù)。它是工作在thrift上的,控制分隔符也允許用戶指定數(shù)據(jù)格式。
Hive的特點(diǎn)
支持索引,加快數(shù)據(jù)查詢。
有不同的存儲(chǔ)類型,如HBase中的文件、純文本文件
將元數(shù)據(jù)保存在關(guān)系數(shù)據(jù)庫中,大大減少了在查詢過程中執(zhí)行語義檢查的時(shí)間
可以直接使用存儲(chǔ)在Hadoop文件系統(tǒng)中的數(shù)據(jù)
內(nèi)置大量用戶函數(shù)UDF來操作時(shí)間、字符串和其他的數(shù)據(jù)挖掘工具,支持用戶擴(kuò)展UDF函數(shù)來 完成內(nèi)置函數(shù)無法實(shí)現(xiàn)的操作
類SQL的查詢方式,將SQL查詢轉(zhuǎn)換為MapReduce的Job在Hadoop集群上執(zhí)行。
Hive的缺點(diǎn)
在靜態(tài)處理的Hadoop上執(zhí)行延遲高,作業(yè)提交和調(diào)度開銷大,有分鐘集的延遲,因此不適合需要低延遲的應(yīng)用,比如練級事務(wù)處理(OLTP)
其中HIVE和hadoop之間的關(guān)系
Hive的架構(gòu)如上圖所示,包含用戶訪問接口(CLI、JDBC/ODBC、WEB GUI和Thrift Server)元數(shù)據(jù)存儲(chǔ)(Metastore),驅(qū)動(dòng)組件(編譯,優(yōu)化,執(zhí)行)。
用戶訪問接口:用戶交互Hive數(shù)據(jù)倉庫的工具接口。
CLI(command line interface)命令行接口。
Thrift Server可以用不同語言調(diào)用Hive接口
HWI(Hive web interface)提供通過網(wǎng)頁訪問Hive提供的服務(wù)
Metastore與Hive驅(qū)動(dòng)互聯(lián)方式:1.集成模式 2.遠(yuǎn)程模式
主要用來存儲(chǔ)Hive中的元數(shù)據(jù),一般使用Mysql或者Derby數(shù)據(jù)庫。
驅(qū)動(dòng)組件包括編譯器、優(yōu)化器和執(zhí)行引擎,分別完成詞法分析、語法分析、編譯、優(yōu)化以及查詢計(jì)劃的生成。生成的查詢計(jì)劃存儲(chǔ)在HDFS中并在雖有由MapperReduce調(diào)用執(zhí)行。
“Hive的特點(diǎn)是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。