溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

NameNode有什么用

發(fā)布時(shí)間:2021-12-30 10:22:33 來源:億速云 閱讀:207 作者:小新 欄目:云計(jì)算

小編給大家分享一下NameNode有什么用,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

一 NameNode的作用

     NameNode是文件系統(tǒng)的大腦,管理文件的命名空間以及對(duì)集群中文件的訪問,存儲(chǔ)著元數(shù)據(jù)。保存的最重要的兩個(gè)映射:文件名&數(shù)據(jù)塊(保存在磁盤上,持久化的)  ,數(shù)據(jù)塊&DateNode列表(NameNode不保存,是通過DataNode傳遞的)。

    NameNode 與客戶端,DataNode,NameNode之間都可以通信,分別通過實(shí)現(xiàn)ClientProtocol,DataNodeProtocol和NameNodeProtocol接口。

二 文件讀寫過程分析

   1 文件讀取過程

       首先客戶端使用FileSystem.open()函數(shù)打開文件,DistributedFileSystem使用RPC與NameNode通信,得到文件的數(shù)據(jù)塊信息,對(duì)于每一個(gè)數(shù)據(jù)塊,元數(shù)據(jù)返回的是保存該數(shù)據(jù)塊的數(shù)據(jù)節(jié)點(diǎn)的地址。

        然后DistributedFileSystem 返回FSDataInputStream 給客戶端用來讀取數(shù)據(jù),客戶端調(diào)用Stream的read()方法開始讀取數(shù)據(jù)。

        DFSInputSteam連接保存此文件第一個(gè)數(shù)據(jù)塊的最近的數(shù)據(jù)節(jié)點(diǎn),data從數(shù)據(jù)節(jié)點(diǎn)讀到客戶端,當(dāng)數(shù)據(jù)塊讀取完畢,DFSInputStream關(guān)閉與此數(shù)據(jù)節(jié)點(diǎn)的連接,連接下一個(gè)數(shù)據(jù)塊的最近的數(shù)據(jù)節(jié)點(diǎn)。當(dāng)所有節(jié)點(diǎn)讀取完畢,調(diào)用FSDataInputSteam的close函數(shù)關(guān)閉。

      在讀取過程中,如果客戶端在與數(shù)據(jù)節(jié)點(diǎn)的通信中,出現(xiàn)錯(cuò)誤,則直接讀取下個(gè)節(jié)點(diǎn),并將此節(jié)點(diǎn)記錄下來。

   2 文件寫入過程

      首先客戶端調(diào)用create()方法創(chuàng)建文件,DistributedFileSystem調(diào)用RPC與NameNode通信,傳達(dá)客戶端要新建一個(gè)文件,元數(shù)據(jù)節(jié)點(diǎn)檢查命名空間,確定文件原來不存在,并且客戶端有創(chuàng)建文件的權(quán)限,然后在創(chuàng)建文件。返回DFSOutputStream,使得客戶端寫入數(shù)據(jù)。

      DFSOutputStream 將數(shù)據(jù)分成塊,寫入data queue,因?yàn)閿?shù)據(jù)的寫入是流式的,data queue 由Data Stream 讀取,并通知其他的數(shù)據(jù)塊(假設(shè)默認(rèn)復(fù)制3塊),分配的數(shù)據(jù)節(jié)點(diǎn)放在一個(gè)pipeline里。

     Data Streamer將數(shù)據(jù)塊寫入pipeline中的第一個(gè)數(shù)據(jù)節(jié)點(diǎn),第一個(gè)數(shù)據(jù)節(jié)點(diǎn)又將數(shù)據(jù)塊寫入第二個(gè)數(shù)據(jù)節(jié)點(diǎn),第二個(gè)數(shù)據(jù)節(jié)點(diǎn)將數(shù)據(jù)寫入第三個(gè)數(shù)據(jù)節(jié)點(diǎn)。DFSOutput Stream為發(fā)出去的數(shù)據(jù)塊保存了ack queue,等待pipeline中的數(shù)據(jù)節(jié)點(diǎn)告知數(shù)據(jù)寫入成功。如果數(shù)據(jù)節(jié)點(diǎn)在寫入過程中失敗,關(guān)閉pipeline,將ack queue 中的數(shù)據(jù)塊放入data queue 的開始。失敗的數(shù)據(jù)節(jié)點(diǎn)從pipeline中移除,另外的數(shù)據(jù)塊則寫入pipeline中另外的兩個(gè)數(shù)據(jù)節(jié)點(diǎn)。元數(shù)據(jù)則被通知,復(fù)制塊數(shù)目不足,將會(huì)創(chuàng)建第三份備份。

   當(dāng)客戶端結(jié)束寫入數(shù)據(jù),則調(diào)用stream的close()函數(shù)

三   java API 對(duì)文件的基本操作

1 FileSystem類(開啟文件系統(tǒng))

Configuration conf=new Configuration();//獲取配置信息
FileSystem fs=FileSystem.get(URI.create(uri),conf);//得到地址
InputStream input=null;
input=fs.open(new Path(uri));
IOUtils.copyBytes(input,System.out,4096,false);//讀取文件,打印出來
IOUtils.closeStream(input);

2 FileStatus類(查看文件狀態(tài))

//查看HDFS中文件或者目錄的元信息。
FileStatus fstus=fs.getFileStatus(new Path(uri));
fstus.getPath();//得到文件路徑
fstus.getLen(); //得到文件長度
fstus.ModificationTime()//得到最新修改時(shí)間
fstus.getReplication()//得到文件備份樹
fstus.getOwner()//得到文件擁有者

3 BlockLocation(查看數(shù)據(jù)塊的位置)

//查找某個(gè)文件Block在HDFS集群的位置。
FileStatus fstus=fs.getFileStatus(new Path(uri));
BlockLocation []block=fs.getFileBlockLocations(fstus,0,fstus.getLen));

4 查看文件是否存在

//列出HDFS下的所有文件。檢查是否存在,使用exist()方法。
Path []paths=new Path[args.length];
FileStatus fstus=fs.listStatus(paths);
Path []listedPaths=FileUtil.stat2Paths(fstus);
for(Path p:listedPaths){
       System.out.println(p);
}

以上是“NameNode有什么用”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI