您好,登錄后才能下訂單哦!
這篇文章跟大家分析一下“分布式內(nèi)存文件系統(tǒng)Tachyon是怎樣的”。內(nèi)容詳細(xì)易懂,對“分布式內(nèi)存文件系統(tǒng)Tachyon是怎樣的”感興趣的朋友可以跟著小編的思路慢慢深入來閱讀一下,希望閱讀后能夠?qū)Υ蠹矣兴鶐椭?。下面跟著小編一起深入學(xué)習(xí)“分布式內(nèi)存文件系統(tǒng)Tachyon是怎樣的”的知識吧。
Tachyon是一個(gè)分布式內(nèi)存文件系統(tǒng),可以在集群里以訪問內(nèi)存的速度來訪問存儲在Tachyon里的文件。Tachyon是架構(gòu)在最底層的分布式文件系統(tǒng)和上層的各種計(jì)算框架之間的一種中間件,其主要職責(zé)是將那些不需要落地到DFS里的文件,落地到分布式內(nèi)存文件系統(tǒng)中,來達(dá)到共享內(nèi)存,從而提高效率,減少內(nèi)存冗余,減少GC時(shí)間等。
Tachyon的架構(gòu)是傳統(tǒng)的Master—Slave架構(gòu),這里和Hadoop類似,TachyonMaster里WorkflowManager是 Master進(jìn)程,因?yàn)槭菫榱朔乐箚吸c(diǎn)問題,所以通過Zookeeper做了HA,可以部署多臺Standby Master。Slave是由Worker Daemon和Ramdisk構(gòu)成。Ramdisk使用off heap memory。Master和Worker直接的通訊協(xié)議是Thrift。
下圖是Tachyon的架構(gòu):
Tachyon的容錯(cuò)機(jī)制是怎么樣的呢?
Tachyon使用lineage這個(gè)我們在Spark的RDD里已經(jīng)很熟悉的概念,通過異步的向Tachyon的底層文件系統(tǒng)做Checkpoint。
當(dāng)我們向Tachyon里面寫入文件的時(shí)候,Tachyon會在后臺異步的把這個(gè)文件給checkpoint到它的底層存儲,比如HDFS,S3.. etc...
這里用到了一個(gè)Edge的算法,來決定checkpoint的順序。
比較好的策略是每次當(dāng)前一個(gè)checkpoint完成之后,就會checkpoint一個(gè)最新生成的文件。當(dāng)然像Hadoop,Hive這樣的中間文件,需要?jiǎng)h除的,是不需要checkpoint的。
如下圖所示:
關(guān)于重新計(jì)算時(shí),資源的分配策略:
目前Tachyon支持2種資源分配策略:
1、優(yōu)先級的資源分配策略
2、公平調(diào)度的分配策略
關(guān)于分布式內(nèi)存文件系統(tǒng)Tachyon是怎樣的就分享到這里啦,希望上述內(nèi)容能夠讓大家有所提升。如果想要學(xué)習(xí)更多知識,請大家多多留意小編的更新。謝謝大家關(guān)注一下億速云網(wǎng)站!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。