溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何簡化Hadoop云部署

發(fā)布時間:2021-12-10 11:34:39 來源:億速云 閱讀:130 作者:iii 欄目:大數(shù)據(jù)

本篇內(nèi)容介紹了“如何簡化Hadoop云部署”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

對于大數(shù)據(jù)管理和分析應(yīng)用程序云服務(wù),用戶的關(guān)注度正不斷增長,而為了應(yīng)對這一趨勢,供應(yīng)商已經(jīng)開始努力簡化Hadoop的云部署流程,并試圖降低云端Hadoop的購買價格。

大數(shù)據(jù)和云計算現(xiàn)在對于Hadoop供應(yīng)商和一些大數(shù)據(jù)技術(shù)公司來說,已經(jīng)變得十分重要。這些公司正在嘗試使用新方法,來簡化用戶部署Hadoop云系統(tǒng)的步驟,并降低用戶的部署成本。

例如,Cloudera將計量功能加入其Cloudera  Director工具中,以管理構(gòu)建在Hadoop中的分布式集群。這允許Cloudera用戶采用一種基于使用的定價模型,而不必以節(jié)點(diǎn)為單位進(jìn)行支付,這讓他們能夠運(yùn)行一些因特定目的搭建起來的臨時系統(tǒng),使用完后可以釋放資源,從而避免成本的上升。

在單個Cloudera Director實(shí)例的大數(shù)據(jù)云環(huán)境中,用戶現(xiàn)在可以在其中的多個區(qū)域內(nèi)部署集群。此外,新版本的Cloudera  Enterprise(一個基于Hadoop的大數(shù)據(jù)平臺)實(shí)現(xiàn)了在Amazon Simple Storage Service(S3)數(shù)據(jù)存儲上直接運(yùn)行Apache  Impala SQL-on-Hadoop  查詢引擎。這使得不需要移動數(shù)據(jù)到Hadoop分布式文件系統(tǒng)就可以實(shí)現(xiàn)查詢操作,這也為用戶在AWS云上部署臨時系統(tǒng)提供了便利。

按需定價以及對Impala-on-S3的支持,在Narasimhan Sampath看來是非常有用的,他是Choice Hotels  International  Inc.公司的系統(tǒng)架構(gòu)師,這家公司在AWS云上運(yùn)行著Cloudera-based集群,這些集群與Spark數(shù)據(jù)處理引擎和Kafka信息查詢系統(tǒng)等技術(shù)協(xié)同工作,以支持各種自助分析應(yīng)用程序。

把你的集群遷移到云上

在Strata + Hadoop World  2016會談中,Sampath表示,Choice遵循了BYOC的方式,將自己的集群,以按需的方式部署到云環(huán)境。例如,營銷部門的集群可以部署到云中,完成一項(xiàng)工作,然后釋放資源。同樣地,開發(fā)團(tuán)隊的集群每天運(yùn)行12小時,然后在夜間關(guān)閉,以節(jié)省公司在AWS云上的投入。

Cloudera的計量定價方式非常適合這種情景,Sampath在會談結(jié)束后說道。“我并不需要購買500個(Cloudera)許可證,除非我無時無刻都在使用這些資源。這和亞馬遜的模型是一樣的?!?/p>

他補(bǔ)充道,Choice過去六個月與Cloudera進(jìn)行了十分緊密的合作,試圖連接S3和Impala,Impala最初由Cloudera作為開源軟件發(fā)布。Choice使用S3作為數(shù)據(jù)存儲。Sampath說,Impala對新查詢的支持為BYOC策略提供了額外的靈活性。

Cloudera負(fù)責(zé)云產(chǎn)品營銷的主管David  Tishgart表示,他們已經(jīng)越來越樂意在客戶中推廣云。但直到現(xiàn)在,他們對臨時系統(tǒng)也沒有太好的解決方案,也不能隨便增加或減少工作負(fù)載。他承認(rèn),由于這個原因,大多數(shù)Cloudera用戶選擇了在云中長期運(yùn)行集群,而不是采取臨時的方式。

追上Hadoop 云的腳步

隨著越來越多的用戶展示出對云的興趣,Clouder需要與Amazon Elastic  MapReduce(EMR),AWS提供的Hadoop云平臺進(jìn)行競爭。此外,Cloudera還發(fā)現(xiàn),自己在與微軟Azure  HDInsight大數(shù)據(jù)云服務(wù)的競爭中也處于劣勢,該平臺基于Hortonworks Inc .的Hadoop的分布式環(huán)境。

根據(jù)Gartner分析師Merv Adrian所述,從用戶數(shù)量的角度看,EMR已經(jīng)讓AWS成為了***的Hadoop供應(yīng)商。AWS最初落后于其他Apache  Hadoop競爭對手,但兩年前這種情況得以改變,現(xiàn)在AWS Hadoop用戶數(shù)比其他廠商總和還要多。

Hortonworks還專注于擴(kuò)展Hadoop云功能,他們表示,HDInsight現(xiàn)在運(yùn)行著2.5版的Hortonworks數(shù)據(jù)平臺(HDP)。此外,Hortonworks現(xiàn)在還支持Microsoft’s  Azure Active Directory service 和Apache Ranger的集成。(Apache  Ranger是一個用來管理Hadoop數(shù)據(jù)安全性和用戶訪問權(quán)限的框架)

盡管與微軟云環(huán)境關(guān)系密切,但Hortonworks也提供HDP的技術(shù)預(yù)覽版,以便AWS用戶使用Spark和Apache  Hive搭建臨時集群?!拔覀兞私馑性骗h(huán)境上的工作負(fù)載情況,”該公司主管全球營銷的高級副總裁Matt Morgan說道。

Paxata公司也開始使用云環(huán)境。這家自助服務(wù)數(shù)據(jù)準(zhǔn)備軟件的供應(yīng)商提供了一個新工具,叫做Paxata  Connect,它可以匯總運(yùn)行在不同Hadoop集群上的數(shù)據(jù),其中也包括獨(dú)立云平臺中的數(shù)據(jù)。Paxata***產(chǎn)品官Nenshad  Bardoliwalla說道,很多Hadoop的工作負(fù)載都已遷移到云,能夠創(chuàng)建“臨時”集群,運(yùn)行特定的工作,然后釋放資源,這種模式的誘惑十分巨大。

“如何簡化Hadoop云部署”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI