溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Hadoop中的MapReduce是什么

發(fā)布時(shí)間:2021-12-09 15:46:48 來源:億速云 閱讀:196 作者:小新 欄目:云計(jì)算

小編給大家分享一下Hadoop中的MapReduce是什么,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

        在MapReduce中,它也是主從結(jié)構(gòu),主節(jié)點(diǎn):JobTracker,從節(jié)點(diǎn):TaskTracker。主節(jié)點(diǎn)只有一個(gè)從節(jié)點(diǎn)有很多個(gè),主節(jié)點(diǎn)在主機(jī)上,從節(jié)點(diǎn)分布到其他機(jī)器上。

        JobTracker

                    作用:

                            1、負(fù)責(zé)接收用戶提交的作業(yè);

                            2、負(fù)責(zé)把計(jì)算任務(wù)分給TaskTracker執(zhí)行;

                            3、監(jiān)控TaskTracker的執(zhí)行情況;

        TaskTracker:

                    作用:

                            1、執(zhí)行JobTracker分配的計(jì)算任務(wù);

            JobClient

                    概念:是用戶作業(yè)與JobTracker交互的主要接口。

                     作用:

                            1、負(fù)責(zé)提交作業(yè),負(fù)責(zé)啟動(dòng);

                            2、跟蹤任務(wù)執(zhí)行;

                            3、訪問任務(wù)狀態(tài)和日志等;

Hadoop中基于RPC的通信協(xié)議

                    1、JobSubmissionProtocol:是JobClient與JobTracker通信的接口。

                                執(zhí)行過程:TaskTracker每隔一段時(shí)間向JobTracker發(fā)送hearbeat(心跳機(jī)制)提交當(dāng)前TaskTracker所在機(jī)

                                器的內(nèi)存,CPU,磁盤等狀態(tài)信息,是否可以接收新任務(wù)等信息;JobTracker接收到hearbeat

                                給TaskTracker返回需要所做的job或task操作,是否開啟新的任務(wù)。TaskTracker可以從取

                                得JobTracker取得當(dāng)前文件系統(tǒng)路徑,需要執(zhí)行Job的Jar文件路徑等.

                           2、InterTrackerProtocol:是TaskTracker與JobTracker通信的接口。

                                作用:主要用來提交,執(zhí)行Job和取得當(dāng)前Job狀態(tài);JobClient可以通過此協(xié)議提交Job(submitJob),

                                          取得當(dāng)前Job的參數(shù),狀態(tài),Counter,Task狀態(tài),文件系統(tǒng)路徑,jar文件路徑,所有Job的狀

                                          態(tài),還有Job隊(duì)列的信息,此外JobClient還可以提交KillJob和設(shè)定Job優(yōu)先級(jí)等任務(wù)到                                                          JobTracker。

MapReduce中驅(qū)動(dòng)默認(rèn)設(shè)置

InputFormat

TextInputFormat

MapperClass

IdentityMapper

MapOutputKeyClass

LongWritable

MapOutputValueClass

Text

PartitionerClass

HashPartitioner

ReduceClass

IdentityReduce

OutputKeyClass

LongWritable

OutputValueClass

Text

OutputFormatClass

TextOutputFormat

MapReduce中常見的算法

                                1、單詞計(jì)數(shù)

                                2、數(shù)據(jù)去重

                                3、排序

                                4、Top k

                                5、選擇

                                6、投影

                                7、分組

                                8、多表連接

                                9、單表關(guān)聯(lián)

MapReduce原理

                        Hadoop中的MapReduce是什么

MapReduce為什么能實(shí)現(xiàn)失敗檢測(cè)?

                    正是由于采用了無共享框架,所有MapReduce才能夠?qū)崿F(xiàn)失敗檢測(cè),這也意味著各個(gè)任務(wù)之間彼此獨(dú)立。

MapReduce作業(yè)

                    MapReduce作業(yè)(Job)是客戶端需要執(zhí)行的一個(gè)工作單元:它包括輸入數(shù)據(jù),MapReduce程序和配置信息等。

                    注意:在MapReduce中不能處理文件名以_(下劃線)開頭的文件.

以上是“Hadoop中的MapReduce是什么”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI