溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何分析Flink中的KeyBy

發(fā)布時間:2021-12-23 18:40:24 來源:億速云 閱讀:710 作者:柒染 欄目:大數據

如何分析Flink中的KeyBy,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。

KeyBy算子:將數據流按照指定key進行分區(qū)(分組)

示例環(huán)境

java.version: 1.8.x
flink.version: 1.11.1

 示例數據源 (項目碼云下載)

Flink 系例 之 搭建開發(fā)環(huán)境與數據

KeyBy.java

package com.flink.examples.functions;

import com.flink.examples.DataSource;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import java.util.List;

/**
 * @Description KeyBy算子:將數據流按照指定key進行分區(qū)
 */
public class KeyBy {

    /**
     * 遍歷集合,將用戶按性別分成兩類
     * @param args
     * @throws Exception
     */
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        //如果有多個分區(qū),則設置并行度需大于1,或者在算子上設置setParallelism(2)前行度,否則算子只有一個并行度,則計算結果始終只有一個分區(qū)
//        env.setParallelism(4);
        List<Tuple3<String,String,Integer>> tuple3List = DataSource.getTuple3ToList();
        DataStream<Tuple3<String,String,Integer>> dataStream = env.fromCollection(tuple3List);
        //注意:使用Integer進行分區(qū)時,會導致分區(qū)結果不對,轉換成String類型輸出key即可正確輸出
        KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy(new KeySelector<Tuple3<String,String,Integer>, String>() {
            @Override
            public String getKey(Tuple3<String, String, Integer> tuple3) throws Exception {
                //f1為性別字段,以相同f1值(性別)進行分區(qū)
                return String.valueOf(tuple3.f1);
            }
        });

        //lambda
//        KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy((KeySelector<Tuple3<String, String, Integer>, String>) t3 -> t3.f1);
        //指定第幾個字段做為key進行計算
//        KeyedStream<Tuple3<String,String,Integer>, Tuple> keyedStream = dataStream.keyBy(1);
        keyedStream.print().setParallelism(4);
        env.execute("flink keyBy job");
    }
}

打印結果

2> (張三,man,20)
4> (李四,girl,24)
2> (王五,man,29)
4> (劉六,girl,32)
2> (吳八,man,30)
4> (伍七,girl,18)

關于如何分析Flink中的KeyBy問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業(yè)資訊頻道了解更多相關知識。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI