如何分析Flink中的KeyBy

發(fā)布時間：2021-12-23 18:40:24 來源：億速云閱讀：710 作者：柒染欄目：大數據

如何分析Flink中的KeyBy，針對這個問題，這篇文章詳細介紹了相對應的分析和解答，希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

KeyBy算子：將數據流按照指定key進行分區(qū)（分組）

示例環(huán)境

java.version: 1.8.x
flink.version: 1.11.1

示例數據源（項目碼云下載）

Flink 系例之搭建開發(fā)環(huán)境與數據

KeyBy.java

package com.flink.examples.functions;

import com.flink.examples.DataSource;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import java.util.List;

/**
 * @Description KeyBy算子：將數據流按照指定key進行分區(qū)
 */
public class KeyBy {

    /**
     * 遍歷集合，將用戶按性別分成兩類
     * @param args
     * @throws Exception
     */
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //如果有多個分區(qū)，則設置并行度需大于1,或者在算子上設置setParallelism(2)前行度，否則算子只有一個并行度，則計算結果始終只有一個分區(qū)
//        env.setParallelism(4);
        List<Tuple3<String,String,Integer>> tuple3List = DataSource.getTuple3ToList();
        DataStream<Tuple3<String,String,Integer>> dataStream = env.fromCollection(tuple3List);
        //注意：使用Integer進行分區(qū)時，會導致分區(qū)結果不對，轉換成String類型輸出key即可正確輸出
        KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy(new KeySelector<Tuple3<String,String,Integer>, String>() {
            @Override
            public String getKey(Tuple3<String, String, Integer> tuple3) throws Exception {
                //f1為性別字段,以相同f1值（性別）進行分區(qū)
                return String.valueOf(tuple3.f1);
            }
        });

        //lambda
//        KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy((KeySelector<Tuple3<String, String, Integer>, String>) t3 -> t3.f1);
        //指定第幾個字段做為key進行計算
//        KeyedStream<Tuple3<String,String,Integer>, Tuple> keyedStream = dataStream.keyBy(1);
        keyedStream.print().setParallelism(4);
        env.execute("flink keyBy job");
    }
}

打印結果

2> (張三,man,20)
4> (李四,girl,24)
2> (王五,man,29)
4> (劉六,girl,32)
2> (吳八,man,30)
4> (伍七,girl,18)

關于如何分析Flink中的KeyBy問題的解答就分享到這里了，希望以上內容可以對大家有一定的幫助，如果你還有很多疑惑沒有解開，可以關注億速云行業(yè)資訊頻道了解更多相關知識。

向AI問一下細節(jié)

如何分析Flink中的KeyBy

猜你喜歡

最新資訊

相關推薦

相關標簽