您好,登錄后才能下訂單哦!
這篇文章主要介紹hadoop中的三大組件分別是什么,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!
hadoop三大組件:1、HDFS,一個(gè)高可靠、高吞吐量的分布式文件系統(tǒng);2、MapReduce,一個(gè)分布式的離線并行計(jì)算框架;3、Yarn,分布式資源管理框架。
hadoop三大組件:
1、HDFS
一個(gè)高可靠、高吞吐量的分布式文件系統(tǒng)
存儲(chǔ)海量數(shù)據(jù)
分布式
安全性
副本數(shù)據(jù)
數(shù)據(jù)是以block的方式進(jìn)行存儲(chǔ)的,128M
比如:200M—128M 72M
2、MapReduce
一個(gè)分布式的離線并行計(jì)算框架
對(duì)海量數(shù)據(jù)的處理
分布式
思想:
分而治之
大數(shù)據(jù)集分為小的數(shù)據(jù)集
每個(gè)數(shù)據(jù)集進(jìn)行邏輯業(yè)務(wù)處理(map)
合并統(tǒng)計(jì)數(shù)據(jù)結(jié)果(reduce)
3、Yarn
分布式資源管理框架
管理整個(gè)集群的資源(內(nèi)存、CPU核數(shù))
分配調(diào)度集群的資源
以上是“hadoop中的三大組件分別是什么”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。