您好,登錄后才能下訂單哦!
如何分析Flink中的KeyBy,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
KeyBy算子:將數據流按照指定key進行分區(qū)(分組)
示例環(huán)境
java.version: 1.8.x flink.version: 1.11.1
示例數據源 (項目碼云下載)
Flink 系例 之 搭建開發(fā)環(huán)境與數據
KeyBy.java
package com.flink.examples.functions; import com.flink.examples.DataSource; import org.apache.flink.api.java.functions.KeySelector; import org.apache.flink.api.java.tuple.Tuple3; import org.apache.flink.streaming.api.datastream.DataStream; import org.apache.flink.streaming.api.datastream.KeyedStream; import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment; import java.util.List; /** * @Description KeyBy算子:將數據流按照指定key進行分區(qū) */ public class KeyBy { /** * 遍歷集合,將用戶按性別分成兩類 * @param args * @throws Exception */ public static void main(String[] args) throws Exception { final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); //如果有多個分區(qū),則設置并行度需大于1,或者在算子上設置setParallelism(2)前行度,否則算子只有一個并行度,則計算結果始終只有一個分區(qū) // env.setParallelism(4); List<Tuple3<String,String,Integer>> tuple3List = DataSource.getTuple3ToList(); DataStream<Tuple3<String,String,Integer>> dataStream = env.fromCollection(tuple3List); //注意:使用Integer進行分區(qū)時,會導致分區(qū)結果不對,轉換成String類型輸出key即可正確輸出 KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy(new KeySelector<Tuple3<String,String,Integer>, String>() { @Override public String getKey(Tuple3<String, String, Integer> tuple3) throws Exception { //f1為性別字段,以相同f1值(性別)進行分區(qū) return String.valueOf(tuple3.f1); } }); //lambda // KeyedStream<Tuple3<String,String,Integer>, String> keyedStream = dataStream.keyBy((KeySelector<Tuple3<String, String, Integer>, String>) t3 -> t3.f1); //指定第幾個字段做為key進行計算 // KeyedStream<Tuple3<String,String,Integer>, Tuple> keyedStream = dataStream.keyBy(1); keyedStream.print().setParallelism(4); env.execute("flink keyBy job"); } }
打印結果
2> (張三,man,20) 4> (李四,girl,24) 2> (王五,man,29) 4> (劉六,girl,32) 2> (吳八,man,30) 4> (伍七,girl,18)
關于如何分析Flink中的KeyBy問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業(yè)資訊頻道了解更多相關知識。
免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。