溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

MapReduce如何實(shí)現(xiàn)驅(qū)動(dòng)程序

發(fā)布時(shí)間:2021-12-10 13:51:02 來源:億速云 閱讀:124 作者:小新 欄目:云計(jì)算

這篇文章給大家分享的是有關(guān)MapReduce如何實(shí)現(xiàn)驅(qū)動(dòng)程序的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

1、設(shè)置job的基礎(chǔ)屬性

Job job = new Job();  
job.setJarByClass(***.class);  //要執(zhí)行的類
job.setJobName(“job name”);    //作業(yè)的名字
job.setNumReduce(2);           //reduce的數(shù)目

2、設(shè)置Map與Reudce的類

job.setMappgerClass(*.class);  //map類
job.setReduceClass(*.class);   //reduce類

3、設(shè)置Job的輸入輸出格式

void    setInputFormatClass(Class<? extends InputFormat> cls)  
void    setOutputFormatClass(Class<? extends OutputFormat> cls)

前者默認(rèn)是TextInputFormat,后者是FileOutputFormat。

4、設(shè)置Job的輸入輸出路徑

當(dāng)輸入輸出是文件時(shí),需要指定路徑。

InputFormat:  
static void    addInputPath(JobConf conf, Path path)   
FileOutputFormat:  
static void    setOutputPath(Job job, Path outputDir)

當(dāng)輸入格式是其它類型時(shí),則需要指定相應(yīng)的屬性,如Gora的DataSource。

5、設(shè)置map與reduce的輸出鍵值類型
主要有以下4個(gè)類

void    setOutputKeyClass(Class<?> theClass)  
void    setOutputValueClass(Class<?> theClass)   
void    setMapOutputKeyClass(Class<?> theClass)  
void    setMapOutputValueClass(Class<?> theClass)

(1)前面2個(gè)方法設(shè)置整個(gè)job的輸出,即reduce的輸出。默認(rèn)情況下,map的輸出類型與reduce一致,若二者不一致,則需要通過后面2個(gè)方法來指定map的輸出類型。
(2)關(guān)于輸入類型的說明:reduce的輸入類型由output的輸出類型決定。map的輸入類型由輸入格式?jīng)Q定,如輸入格式是FileInputFormat,則輸入KV類型為LongWriterable與Text。

6、運(yùn)行程序

job.waitForCompletion()

我們還可以設(shè)置combine類和partition類

job.setCombinerClass(Combine.class);
job.setPartitionerClass(MyPartition.class);

 附帶一張圖:

MapReduce如何實(shí)現(xiàn)驅(qū)動(dòng)程序

完整例子

package org.jediael.hadoopdemo.maxtemperature;  
  
import org.apache.hadoop.fs.Path;  
import org.apache.hadoop.io.IntWritable;  
import org.apache.hadoop.io.Text;  
import org.apache.hadoop.mapreduce.Job;  
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;  
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;  
  
public class MaxTemperature {  
    public static void main(String[] args) throws Exception {  
        if (args.length != 2) {  
            System.err  
                    .println("Usage: MaxTemperature <input path> <output path>");  
            System.exit(-1);  
        }  
        //1、設(shè)置job的基礎(chǔ)屬性  
        Job job = new Job();  
        job.setJarByClass(MaxTemperature.class);  
        job.setJobName("Max temperature");  
  
        //2、設(shè)置Map與Reudce的類  
        job.setMapperClass(MaxTemperatureMapper.class);  
        job.setReducerClass(MaxTemperatureReducer.class);  
          
        //4、設(shè)置map與reduce的輸出鍵值類型  
        job.setOutputKeyClass(Text.class);  
        job.setOutputValueClass(IntWritable.class);  
          
        //5、設(shè)置輸入輸出路徑  
        FileInputFormat.addInputPath(job, new Path(args[0]));  
        FileOutputFormat.setOutputPath(job, new Path(args[1]));  
          
        //6、運(yùn)行程序  
        System.exit(job.waitForCompletion(true) ? 0 : 1);  
    }  
}

感謝各位的閱讀!關(guān)于“MapReduce如何實(shí)現(xiàn)驅(qū)動(dòng)程序”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI