您好,登錄后才能下訂單哦!
Apache Flink 誤用的是示例分析,針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。
1. 項(xiàng)目開(kāi)始
a) 從一個(gè)具有挑戰(zhàn)性的用例開(kāi)始(端對(duì)端的 Exactly-once、大狀態(tài)、復(fù)雜的業(yè)務(wù)邏輯、強(qiáng)實(shí)時(shí)SLA的組合) b) 之前沒(méi)有流處理經(jīng)驗(yàn) c) 不對(duì)團(tuán)隊(duì)做相關(guān)的培訓(xùn) d) 不利用社區(qū)
郵件列表:
user@flink.apache.com/user-zh@flink.apache.org
Stack Overflow:
www.stackoverflow.com
2. 設(shè)計(jì)分析
a) 不考慮數(shù)據(jù)一致性和交付保證 b) 不考慮業(yè)務(wù)升級(jí)和應(yīng)用改進(jìn) c) 不考慮業(yè)務(wù)規(guī)模問(wèn)題 d) 不深入思考實(shí)際業(yè)務(wù)需求
a 升級(jí)集群版本 b 業(yè)務(wù) bug 的修復(fù) c 業(yè)務(wù)邏輯(拓?fù)洌┑淖兏?/pre>
3. 開(kāi)發(fā)
a) 在升級(jí)過(guò)程中要改變狀態(tài) b) 不能丟失遲到的數(shù)據(jù) c) 在運(yùn)行時(shí)更改程序的行為
3.2 數(shù)據(jù)類型
a) 使用深度嵌套的復(fù)雜數(shù)據(jù)類型b) KeySelector 中使用任意類型
3.3 序列化
3.4 并發(fā)性
任務(wù)之間共享靜態(tài)變量
在用戶函數(shù)中生成線程
3.5 窗口
4. 測(cè)試
5. 上線
6. 維護(hù)
7.PyFlink/SQL/TableAPI 的補(bǔ)充
使用 TableEnvironment 還是 StreamTableEnvironment?推薦 TableEnvironment 。(分段優(yōu)化)
State TTL 未設(shè)置,導(dǎo)致 State 無(wú)限增長(zhǎng),或者 State TTL 設(shè)置不結(jié)合業(yè)務(wù)需求,導(dǎo)致數(shù)據(jù)正確性問(wèn)題。
不支持作業(yè)升級(jí),例如增加一個(gè) COUNT SUM 會(huì)導(dǎo)致作業(yè) state 不兼容。
解析 JSON 時(shí),重復(fù)調(diào)度 UDF,嚴(yán)重影響性能,建議替換成 UDTF。
多流 JOIN 的時(shí)候,先做小表 JOIN,再做大表 JOIN。目前,F(xiàn)link 還沒(méi)有表的 meta 信息,沒(méi)法在 plan 優(yōu)化時(shí)自動(dòng)做 join reorder。
關(guān)于Apache Flink 誤用的是示例分析問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開(kāi),可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。