您好,登錄后才能下訂單哦!
小編給大家分享一下Apache Phoenix for CDH的示例分析,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!
Cloudera正式宣布在CDH中支持Apache Phoenix,同時(shí)也會(huì)集成到未來(lái)的Cloudera Data Platform中。
Cloudera的CDH發(fā)行版其實(shí)一直包含Apache HBase服務(wù),它為希望利用大數(shù)據(jù)功能的客戶的操作型應(yīng)用程序提供了一個(gè)靈活的NoSQL數(shù)據(jù)庫(kù)。這些應(yīng)用程序已經(jīng)發(fā)展成為重要且核心的應(yīng)用程序,可以推動(dòng)收入和利潤(rùn)的增長(zhǎng)。這些應(yīng)用程序包括面向客戶的應(yīng)用程序,電子商務(wù)平臺(tái),銀行的風(fēng)控和反欺詐,或?yàn)閼?yīng)用程序提供AI/ML模型,以及根據(jù)實(shí)際結(jié)果進(jìn)一步加強(qiáng)訓(xùn)練。
但是,對(duì)于許多客戶來(lái)說(shuō),使用HBase其實(shí)很抗拒,因?yàn)椋?/p>
1.HBase的數(shù)據(jù)模型是一張大寬表,支持上百萬(wàn)個(gè)column,但卻不支持join
2.使用Java APIs而不是ANSI SQL
他們要求能夠使用類似于Oracle或MySQL提供的更傳統(tǒng)的schema設(shè)計(jì),并且愿意在靈活性方面做出一些權(quán)衡,例如:
1.他們?cè)敢馐褂锰峁┑臄?shù)據(jù)類型,而不是定義自己的數(shù)據(jù)類型
2.他們?cè)敢夥艞夓`活性,讓單個(gè)column具有多種類型,具體取決于行,以換取單行中的單個(gè)類型
為了使客戶輕松擁有Apache HBase的其它優(yōu)勢(shì)(無(wú)限擴(kuò)展,數(shù)百萬(wàn)行,模式演變等),同時(shí)提供類似RDBMS的功能(ANSI SQL,簡(jiǎn)單join,開(kāi)箱即用的數(shù)據(jù)類型等),我們?cè)贑DH上引入了對(duì)Apache Phoenix的支持。
如果優(yōu)化HBase,基于Phoenix的應(yīng)用程序同樣也會(huì)受益,從而獲得更好的性能。例如Phoenix實(shí)現(xiàn)了主鍵的加鹽 - 因此HBase用戶不用考慮Rowkey的設(shè)計(jì)。
此外,基于Phoenix的應(yīng)用程序可以與HBase應(yīng)用程序共存 - 這意味著您可以使用單個(gè)HBase集群來(lái)支持這兩者。使用Phoenix,客戶可以繼續(xù)使用他們喜歡的BI和儀表盤(pán)工具,就像以前使用Hive和Impala一樣。
在CDH中從安全和治理角度,Phoenix使用HBase ACLs來(lái)實(shí)現(xiàn)Phoenix表的基于角色訪問(wèn)控制。同時(shí)Cloudera Navigatior也會(huì)捕獲Phoenix的審計(jì)信息。
現(xiàn)在,Cloudera發(fā)布的主要是基于CDH5.16.2的Phoenix4.14.1 Parcel包,不久之后我們將會(huì)發(fā)布CDH6.2的Phoenix5.0的Parcel包,因?yàn)镃6中的HBase已經(jīng)是2.x,所以會(huì)不一樣。
已有的HDP客戶其實(shí)一直可以享有Apache Phoenix的技術(shù)支持,使用HDP的HBase的用戶幾乎有一半正在使用Phoenix,同時(shí)Phoenix在HBase的用戶社區(qū)也很受歡迎。
使用Apache Phoenix構(gòu)建核心應(yīng)用程序,請(qǐng)點(diǎn)擊以下鏈接下載Phoenix:
https://www.cloudera.com/downloads/phoenix.html
Q)Phoenix適用于什么樣的工作負(fù)載
Phoenix支持與HBase相同的用例場(chǎng)景,主要是低延遲,高并發(fā)的工作負(fù)載。但是,Phoenix還可以更輕松地利用底層數(shù)據(jù)進(jìn)行儀表板和BI應(yīng)用。
Q) Phoenix的授權(quán)機(jī)制是什么?
Phoenix依賴于HBase的授權(quán)機(jī)制,對(duì)于CDH客戶,可以使用HBase ACL。對(duì)于HDP客戶,可以使用Ranger。
Q) Phoenix的可擴(kuò)展性怎樣?已知的最大的集群是哪個(gè)?
Phoenix可以擴(kuò)展到數(shù)百TB的數(shù)據(jù)。最大的客戶擁有超過(guò)0.5 PB的數(shù)據(jù),由Phoenix管理。該用例的詳細(xì)信息可以在PhoenixCon archives找到:
https://phoenix.apache.org/phoenixcon-archives.html
也可以在今年早些時(shí)候用戶自己的視頻中 NoSQL day videos查看:
https://www.youtube.com/playlist?list=PLSAiKuajRe2l6If7Az2PHIDG8vsJly9CH
Q) Phoenix是否支持地理空間二級(jí)索引?支持什么級(jí)別的空間數(shù)據(jù)?
它對(duì)地理空間(geo-spatial)數(shù)據(jù)的支持有限。GeoMesa在HBase上提供了一個(gè)geospatial層,可以支持這種需求并與客戶應(yīng)用程序集成。Phoenix,GeoMesa以及JanusGraph和OpenTSDB都可以共存于一個(gè)HBase集群中。
Q) 如何創(chuàng)建和使用索引?
有關(guān)索引的詳細(xì)信息,請(qǐng)參閱Phoenix Secondary Indexing頁(yè)面。
https://phoenix.apache.org/secondary_indexing.html
從Phoenix 4.8.0開(kāi)始,使用本地索引不需要進(jìn)行任何配置。
Q) 做索引的column數(shù)量有限制嗎?
與RDBMS一樣,HBase的二級(jí)索引其實(shí)就是使用另一張索引表來(lái)實(shí)現(xiàn)的,這張表包含索引和源數(shù)據(jù)的鏈接。如果你對(duì)所有column都進(jìn)行索引,你的維護(hù)成本會(huì)大大上升。對(duì)于索引的選擇你還同時(shí)需要考慮讀多寫(xiě)少可以考慮Global indexes(全局索引),如果寫(xiě)多讀少,則可以考慮Local indexes(本地索引)。
看完了這篇文章,相信你對(duì)“Apache Phoenix for CDH的示例分析”有了一定的了解,如果想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。