<noscript id="enfbo"></noscript>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Java大數(shù)據(jù)開發(fā)中Hadoop的HDFS內(nèi)部原理是什么

發(fā)布時(shí)間：2021-12-09 09:46:47 來(lái)源：億速云閱讀：140 作者：小新欄目：大數(shù)據(jù)

這篇文章將為大家詳細(xì)講解有關(guān)Java大數(shù)據(jù)開發(fā)中Hadoop的HDFS內(nèi)部原理是什么，小編覺得挺實(shí)用的，因此分享給大家做個(gè)參考，希望大家閱讀完這篇文章后可以有所收獲。

HDFS寫數(shù)據(jù)流程

Java大數(shù)據(jù)開發(fā)中Hadoop的HDFS內(nèi)部原理是什么

1、客戶端向NameNode請(qǐng)求上傳文件，NameNode會(huì)檢查目標(biāo)文件是否已存在，父目錄是否存在。所以NameNode起到了統(tǒng)一管理的作用。

2、NameNode返回是否可以上傳，NameNode知道每一個(gè)數(shù)據(jù)節(jié)點(diǎn)的情況。

3、客戶端請(qǐng)求第一個(gè)塊( block)上傳到集群上哪幾個(gè)DataNode服務(wù)器上。

4、NameNode返回3個(gè)DataNode節(jié)點(diǎn)，分別為dn1、dn2、dn3三個(gè)節(jié)點(diǎn)。集群在啟動(dòng)的時(shí)候NameNode就已經(jīng)知道DataNode節(jié)點(diǎn)了、

5、客戶端請(qǐng)求dn1上傳數(shù)據(jù)，dn1收到請(qǐng)求會(huì)繼續(xù)調(diào)用dn2，然后dn2調(diào)用dn3，將這個(gè)通信管道建立完成。

6、dn1、dn2、dn3依次逐級(jí)應(yīng)答客戶端。

7、客戶端開始往dn1上傳第一個(gè)block（先從磁盤讀取數(shù)據(jù)放到一個(gè)本地內(nèi)存緩存），以packet為單位，dn1收到一個(gè)packet就會(huì)傳給dn2，dn2傳給dn3；dn1每傳一個(gè)packet會(huì)放入一個(gè)應(yīng)答隊(duì)列等待應(yīng)答。

8、當(dāng)一個(gè)block傳輸完成之后，客戶端再次請(qǐng)求NameNode上傳第二個(gè)block的服務(wù)器。（重復(fù)執(zhí)行3-7步）。

網(wǎng)絡(luò)拓?fù)涓拍?/strong>

在數(shù)據(jù)處理中，兩個(gè)節(jié)點(diǎn)間的帶寬作為距離的衡量標(biāo)準(zhǔn)。

節(jié)點(diǎn)距離：兩個(gè)節(jié)點(diǎn)到達(dá)最近的共同祖先的距離總和。

例如，假設(shè)有數(shù)據(jù)中心d1（d1為集群）機(jī)架r1中的節(jié)點(diǎn)n1。該節(jié)點(diǎn)可以表示為/d1/r1/n1。利用這種標(biāo)記，這里給出四種距離描述。

Range(/d1/r1/n1, /d1/r1/n1)=0（同一節(jié)點(diǎn)上的進(jìn)程）

Range(/d1/r1/n1, /d1/r1/n2)=2（同一機(jī)架上的不同節(jié)點(diǎn)）

Range(/d1/r1/n1, /d1/r3/n2)=4（同一數(shù)據(jù)中心不同機(jī)架上的節(jié)點(diǎn)）

Range(/d1/r1/n1, /d2/r4/n2)=6（不同數(shù)據(jù)中心的節(jié)點(diǎn)）

注意：

對(duì)于n0 n1 n2 ，機(jī)架r1是共同祖先
對(duì)于機(jī)架r1 機(jī)架r12 機(jī)架r13，集群d1是共同祖先

依次類推......

舉例：為什么Range(/d1/r1/n1, /d2/r4/n2)=6？

副本存儲(chǔ)節(jié)點(diǎn)選擇

第一個(gè)副本在集群節(jié)點(diǎn)上，隨機(jī)選一個(gè)。

第二個(gè)副本和第一個(gè)副本位于相同機(jī)架上，但節(jié)點(diǎn)是隨機(jī)的。

第三個(gè)副本位于不同機(jī)架的隨機(jī)節(jié)點(diǎn)上。

HDFS讀數(shù)據(jù)的流程

1、客戶端向NameNode請(qǐng)求下載文件，NameNode會(huì)通過(guò)查詢?cè)獢?shù)據(jù)，找到DataNode地址，即文件塊所在的地址。

2、挑選一臺(tái)DataNode服務(wù)器，至于選哪一臺(tái)機(jī)器是就近原則，然后隨機(jī) ，請(qǐng)求讀取數(shù)據(jù)。

3、DataNode開始傳輸數(shù)據(jù)給客戶端，從磁盤里面讀取數(shù)據(jù)輸入流，以packet為單位來(lái)做校驗(yàn)。

4、客戶端以packet為單位接收，先在本地緩存，然后寫入目標(biāo)文件。

關(guān)于“Java大數(shù)據(jù)開發(fā)中Hadoop的HDFS內(nèi)部原理是什么”這篇文章就分享到這里了，希望以上內(nèi)容可以對(duì)大家有一定的幫助，使各位可以學(xué)到更多知識(shí)，如果覺得文章不錯(cuò)，請(qǐng)把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

推薦閱讀：

Hadoop 系列（七）—— HDFS Java API

Hadoop之HDFS讀寫原理

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

java hdfs hadoop

上一篇新聞：
ClassLoader的分類及加載順序是什么

下一篇新聞：
HBase數(shù)據(jù)模型和表設(shè)計(jì)知識(shí)點(diǎn)有哪些

猜你喜歡

linux怎么快速生成一個(gè)指定大小的文件

linux如何查看gpu使用情況

cms框架的應(yīng)用場(chǎng)景有哪些

c語(yǔ)言字符串輸入的方式有哪些

c#中format的作用是什么

php中call_user_func函數(shù)的作用是什么

linux怎么查看bios信息

C++中DLL導(dǎo)出函數(shù)不成功怎么解決

QT怎么生成dll鏈接庫(kù)

labview怎么添加庫(kù)文件

最新資訊

LAMP環(huán)境MySQL索引優(yōu)化方法

LAMP服務(wù)器資源監(jiān)控與管理技巧

LAMP環(huán)境PHP版本升級(jí)注意事項(xiàng)

Apache在LAMP中的角色與性能考量

LAMP架構(gòu)適合哪些類型網(wǎng)站

Linux中LAMP配置最佳實(shí)踐分享

LAMP與LEMP，Linux服務(wù)器如何選擇

LAMP環(huán)境如何保障網(wǎng)站安全

Linux下LAMP環(huán)境搭建難點(diǎn)解析

LAMP架構(gòu)如何優(yōu)化Linux服務(wù)器性能

相關(guān)推薦

大數(shù)據(jù)Hadoop中HDFS存儲(chǔ)的機(jī)制原理

Java中內(nèi)部類的原理是什么

hadoop中hdfs優(yōu)缺點(diǎn)是什么

Hadoop中Hdfs如何配置

怎么理解Hadoop中的HDFS

HDFS的原理是什么

Hadoop中HDFS的基礎(chǔ)概念是什么

Hadoop中HDFS如何設(shè)計(jì)

zookeeper的內(nèi)部原理是什么

Hadoop之hdfs架構(gòu)原理的示例分析

相關(guān)標(biāo)簽

javabean java編程 java 高并發(fā) 繼續(xù)學(xué)習(xí) part1 凱哥java java學(xué)習(xí)路線 java開發(fā) javassist java程序 java面試 javascrip 初學(xué)java spire.doc for java javaw.exe java亂碼 java1.8 java文件 java版本 javaconfig java7 java10

AI
助
手

產(chǎn)品服務(wù)

云服務(wù)器

高防服務(wù)器

高防IP

裸金屬服務(wù)器

機(jī)柜租用

SSL證書

高防CDN

彈性IP

地區(qū)劃分

中國(guó)香港服務(wù)器

美國(guó)服務(wù)器

德國(guó)服務(wù)器

日本服務(wù)器

韓國(guó)服務(wù)器

新加坡服務(wù)器

專題活動(dòng)

控制臺(tái)

應(yīng)用市場(chǎng)

最新活動(dòng)

幫助支持

幫助中心

網(wǎng)站備案

法律條款

全國(guó)服務(wù)

安全漏洞

主題地圖

關(guān)于我們

關(guān)于億速云

客戶案例

新聞資訊

資訊地圖

問答地圖

聯(lián)系我們

人才招聘

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼

Copyright ? Yisu Cloud Ltd. All Rights Reserved. 2018 版權(quán)所有

廣州億速云計(jì)算有限公司粵ICP備17096448號(hào)-1 粵公網(wǎng)安備 44010402001142號(hào)增值電信業(yè)務(wù)經(jīng)營(yíng)許可證編號(hào)：B1-20181529

感谢您访问我们的网站，您可能还对以下资源感兴趣：
女人爽到高潮潮喷18禁
欧美日韩亚洲国产精品自拍精品丝袜国产自在线拍日本高清视频在线网站 97久久超碰国产精品旧版麻豆久久久国产一区二区三区