溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Flink的Split怎么使用

發(fā)布時間:2021-12-31 10:15:45 來源:億速云 閱讀:164 作者:iii 欄目:大數(shù)據(jù)

這篇文章主要講解了“Flink的Split怎么使用”,文中的講解內(nèi)容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“Flink的Split怎么使用”吧!

Split算子:將數(shù)據(jù)流切分成多個數(shù)據(jù)流(已過時,并且不能二次切分,不建議使用)

示例環(huán)境

java.version: 1.8.x
flink.version: 1.11.1

示例數(shù)據(jù)源 (項目碼云下載)

Flink 系例 之 搭建開發(fā)環(huán)境與數(shù)據(jù)

Split.java

package com.flink.examples.functions;

import com.flink.examples.DataSource;
import org.apache.flink.api.common.functions.MapFunction;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.api.java.tuple.Tuple4;
import org.apache.flink.streaming.api.collector.selector.OutputSelector;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.SplitStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

import java.util.ArrayList;
import java.util.List;

/**
 * @Description Split算子:將數(shù)據(jù)流切分成多個數(shù)據(jù)流(已過時,并且不能二次切分,不建議使用)
 */
public class Split {

    /**
     * 遍歷集合,將數(shù)據(jù)流切分成多個流并打印
     * @param args
     * @throws Exception
     */
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);
        List<Tuple3<String, String, Integer>> tuple3List = DataSource.getTuple3ToList();
        //Datastream
        DataStream<Tuple3<String, String, Integer>> dataStream = env.fromCollection(tuple3List);
        //按性別進行拆分
        //flink.1.11.1顯示SplitStream類過時,推薦用keyBy的方式進行窗口處理或SideOutput側(cè)輸出流處理;注意,使用split切分后的流,不可二次切分,否則會拋異常
        SplitStream<Tuple3<String, String, Integer>> split = dataStream.split(new OutputSelector<Tuple3<String, String, Integer>>() {
            @Override
            public Iterable<String> select(Tuple3<String, String, Integer> value) {
                List<String> output = new ArrayList<String>();
                if (value.f1.equals("man")) {
                    output.add("man");
                } else {
                    output.add("girl");
                }
                return output;
            }
        });

        //查詢指定名稱的數(shù)據(jù)流
        DataStream<Tuple4<String, String, Integer, String>> dataStream1 = split.select("man")
                .map(new MapFunction<Tuple3<String, String, Integer>, Tuple4<String, String, Integer, String>>() {
                    @Override
                    public Tuple4<String, String, Integer, String> map(Tuple3<String, String, Integer> t3) throws Exception {
                        return Tuple4.of(t3.f0, t3.f1, t3.f2, "男");
                    }
                });

        DataStream<Tuple4<String, String, Integer, String>> dataStream2 = split.select("girl")
                .map(new MapFunction<Tuple3<String, String, Integer>, Tuple4<String, String, Integer, String>>() {
                    @Override
                    public Tuple4<String, String, Integer, String> map(Tuple3<String, String, Integer> t3) throws Exception {
                        return Tuple4.of(t3.f0, t3.f1, t3.f2, "女");
                    }
                });
        //打印:男
        dataStream1.print();
        //打?。号?
        dataStream2.print();

        env.execute("flink Split job");
    }
}

 打印結(jié)果

(張三,man,20,男)
(李四,girl,24,女)
(王五,man,29,男)
(劉六,girl,32,女)
(伍七,girl,18,女)
(吳八,man,30,男)

感謝各位的閱讀,以上就是“Flink的Split怎么使用”的內(nèi)容了,經(jīng)過本文的學習后,相信大家對Flink的Split怎么使用這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關(guān)知識點的文章,歡迎關(guān)注!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI