<sub id="tzh51"></sub>

<listing id="tzh51"></listing>

<address id="tzh51"></address>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Flink State 有可能代替數(shù)據(jù)庫嗎？

發(fā)布時間：2020-08-09 19:42:07 來源：ITPUB博客閱讀：208 作者：大濤學(xué)長欄目：數(shù)據(jù)庫

有狀態(tài)的計算作為容錯以及數(shù)據(jù)一致性的保證，是當(dāng)今實時計算必不可少的特性之一，流行的實時計算引擎包括 Google Dataflow、Flink、Spark (Structure) Streaming、Kafka Streams 都分別提供對內(nèi)置 State 的支持。State 的引入使得實時應(yīng)用可以不依賴外部數(shù)據(jù)庫來存儲元數(shù)據(jù)及中間數(shù)據(jù)，部分情況下甚至可以直接用 State 存儲結(jié)果數(shù)據(jù)，這讓業(yè)界不禁思考: State 和 Database 是何種關(guān)系？有沒有可能用 State 來代替數(shù)據(jù)庫呢？

在這個課題上，F(xiàn)link 社區(qū)是比較早就開始探索的?？傮w來說，F(xiàn)link 社區(qū)的努力可以分為兩條線: 一是在作業(yè)運行時通過作業(yè)查詢接口訪問 State 的能力，即 QueryableState；二是通過 State 的離線 dump 文件（Savepoint）來離線查詢和修改 State 的能力，即即將引入的 Savepoint Processor API。

QueryableState

在 2017 年發(fā)布的 Flink 1.2 版本，F(xiàn)link 引入了 QueryableState 的特性以允許用戶通過特定的 client 查詢作業(yè) State 的內(nèi)容 [1]，這意味著 Flink 應(yīng)用可以在完全不依賴 State 存儲介質(zhì)以外的外部存儲的情況下提供實時訪問計算結(jié)果的能力。

只通過 Queryable State 提供實時數(shù)據(jù)訪問

然而，QueryableState 雖然設(shè)想上比較理想化，但由于依賴底層架構(gòu)的改動較多且功能也比較受限，它一直處于 Beta 版本并不能用于生產(chǎn)環(huán)境。針對這個問題，在前段時間騰訊的工程師楊華提出 QueryableState 的改進計劃 [2]。在郵件列表中，社區(qū)就 QueryableState 是否可以用于代替數(shù)據(jù)庫作了討論并出現(xiàn)了不同的觀點。筆者結(jié)合個人見解將 State as Database 的主要優(yōu)缺點整理如下。

優(yōu)點:

更低的數(shù)據(jù)延遲。一般情況下 Flink 應(yīng)用的計算結(jié)果需要同步到外部的數(shù)據(jù)庫，比如定時觸發(fā)輸出窗口計算結(jié)果，而這種同步通常是定時的會帶來一定的延遲，導(dǎo)致計算是實時的而查詢卻不是實時的尷尬局面，而直接 State 則可以避免這個問題。
更強的數(shù)據(jù)一致性保證。根據(jù)外部存儲的特性不同，F(xiàn)link Connector 或者自定義的 SinkFunction 提供的一致性保障也有所差別。比如對于不支持多行事務(wù)的 HBase，F(xiàn)link 只能通過業(yè)務(wù)邏輯的冪等性來保障 Exactly-Once 投遞。相比之下 State 則有妥妥的 Exactly-Once 投遞保證。
節(jié)省資源。因為減少了同步數(shù)據(jù)到外部存儲的需要，我們可以節(jié)省序列化和網(wǎng)絡(luò)傳輸?shù)某杀?，另外?dāng)然還可以節(jié)省數(shù)據(jù)庫成本。

缺點:

SLA 保障不足。數(shù)據(jù)庫技術(shù)已經(jīng)非常成熟，在可用性、容錯性和運維上都很多的積累，在這點上 State 還相當(dāng)于是處于原始人時期。另外從定位上來看，F(xiàn)link 作業(yè)有版本迭代維護或者遇到錯誤自動重啟帶來的 down time，并不能達到數(shù)據(jù)庫在數(shù)據(jù)訪問上的高可用性。
可能導(dǎo)致作業(yè)的不穩(wěn)定。未經(jīng)過考慮的 Ad-hoc Query 可能會要求掃描并返回夸張量級的數(shù)據(jù)，這會系統(tǒng)帶來很大的負荷，很可能影響作業(yè)的正常執(zhí)行。即使是合理的 Query，在并發(fā)數(shù)較多的情況下也可能影響作業(yè)的執(zhí)行效率。
存儲數(shù)據(jù)量不能太大。State 運行時主要存儲在 TaskManager 本地內(nèi)存和磁盤，State 過大會造成 TaskManager OOM 或者磁盤空間不足。另外 State 大意味著 checkpoint 大，導(dǎo)致 checkpoint 可能會超時并顯著延長作業(yè)恢復(fù)時長。
只支持最基礎(chǔ)的查詢。State 只能進行最簡單的數(shù)據(jù)結(jié)構(gòu)查詢，不能像關(guān)系型數(shù)據(jù)庫一樣提供函數(shù)等計算能力，也不支持謂詞下推等優(yōu)化技術(shù)。
只可以讀取，不能修改。State 在運行時只可以被作業(yè)本身修改，如果實在要修改 State 只能通過下文的 Savepoint Processor API 來實現(xiàn)。

總體來說，目前 State 代替數(shù)據(jù)庫的缺點還是遠多于其優(yōu)點，不過對于某些對數(shù)據(jù)可用性要求不高的作業(yè)來說，使用 State 作為數(shù)據(jù)庫還是完全合理的。由于定位上的不同，F(xiàn)link State 在短時間內(nèi)很難看到可以完全替代數(shù)據(jù)庫的可能性，但在數(shù)據(jù)訪問特性上 State 往數(shù)據(jù)庫方向發(fā)展是無需質(zhì)疑的。

Savepoint Processor API

Savepoint Processor API 是社區(qū)最近提出的一個新特性（見 FLIP-42 [3]），用于離線對 State 的 dump 文件 Savepoint 進行分析、修改或者直接根據(jù)數(shù)據(jù)構(gòu)建出一個初始的 Savepoint。Savepoint Processor API 屬于 Flink State Evolution 的 State Management。如果說 QueryableState 是 DSL 的話，F(xiàn)link State Evolution 就是 DML，而 Savepoint Processor API 就是 DML 中最為重要的部分。

Savepoint Processor API 的前身是第三方的 Bravo 項目 [4]，主要思路提供 Savepoint 和 DataSet 相互轉(zhuǎn)換的能力，典型應(yīng)用是 Savepoint 讀取成 DataSet，在 DataSet 上進行修改，然后再寫為一個新的 Savepoint。這適合用于以下的場景:

分析作業(yè) State 以研究其模式和規(guī)律
排查問題或者審計
為新的應(yīng)用構(gòu)建的初始 State
修改 Savepoint，比如:
改變作業(yè)最大并行度
進行巨大的 Schema 改動
修正有問題的 State

Savepoint 作為 State 的 dump 文件，通過 Savepoint Processor API 可以暴露數(shù)據(jù)查詢和修改功能，類似于一個離線的數(shù)據(jù)庫，但 State 的概念和典型關(guān)系型數(shù)據(jù)的概念還是有很多不同，F(xiàn)LIP-43 也對這些差異進行了類比和總結(jié)。

首先 Savepoint 是多個 operator 的 state 的物理存儲集合，不同 operator 的 state 是獨立的，這類似于數(shù)據(jù)庫下不同 namespace 之間的 table。我們可以得到 Savepoint 對應(yīng)數(shù)據(jù)庫，單個 operator 對應(yīng) Namespace。

DatabaseSavepointNamespaceUidTableState

但就 table 而言，其在 Savepoint 里對應(yīng)的概念根據(jù) State 類型的不同而有所差別。State 有 Operator State、Keyed State 和 Broadcast State 三種，其中 Operator State 和 Broadcast State 屬于 non-partitioned state，即沒有按 key 分區(qū)的 state，而相反地 Keyed State 則屬于 partitioned state。對于 non-partitioned state 來說，state 是一個 table，state 的每個元素即是 table 里的一行；而對于 partitioned state 來說，同一個 operator 下的所有 state 對應(yīng)一個 table。這個 table 像是 HBase 一樣有個 row key，然后每個具體的 state 對應(yīng) table 里的一個 column。

舉個例子，假設(shè)有一個游戲玩家得分和在線時長的數(shù)據(jù)流，我們需要用 Keyed State 來記錄玩家所在組的分數(shù)和游戲時長，用 Operator State 記錄玩家的總得分和總時長。

在一段時間內(nèi)數(shù)據(jù)流的輸入如下:

user_iduser_nameuser_groupscore1001PaulA5,0001002CharlotteA3,6001003KateC2,0001004RobertB3,900user_iduser_nameuser_grouptime1001PaulA1,8001002CharlotteA1,2001003KateC6001004RobertB2,000

用 Keyed State ，我們分別注冊 group_score 和 group_time 兩個 MapState 表示組總得分和組總時長，并根據(jù) user_group keyby 數(shù)據(jù)流之后將兩個指標(biāo)的累積值更新到 State 里，得到的表如下:

user_groupgroup_scoregroup_timeA8,6003,000C2,00600B3,9002,000

相對地，假如用 Operator State 來記錄總得分和總時長（并行度設(shè)為 1），我們注冊 total_score 和 total_time 兩個 State，得到的表有兩個:

total_score | ------- | 14,500 |

total_time5,600

至此 Savepoint 和 Database 的對應(yīng)關(guān)系應(yīng)該是比較清晰明了的。而對于 Savepoint 來說還有不同的 StateBackend 來決定 State 具體如何持續(xù)化，這顯然對應(yīng)的是數(shù)據(jù)庫的存儲引擎。在 MySQL 中，我們可以通過簡單的一行命令 ALTER TABLE xxx ENGINE = InnoDB; 來改變存儲引擎，在背后 MySQL 會自動完成繁瑣的格式轉(zhuǎn)換工作。而對于 Savepoint 來說，由于 StateBackend 各自的存儲格式不兼容，目前尚不能方便地切換 StateBackend。為此，社區(qū)在不久前創(chuàng)建 FLIP-41 [5] 來進一步完善 Savepoint 的可操作性。

總結(jié)

State as Database 是實時計算發(fā)展的大趨勢，它并不是要代替數(shù)據(jù)庫的使用，而是借鑒數(shù)據(jù)庫領(lǐng)域的經(jīng)驗拓展 State 接口使其操作方式更接近我們熟悉的數(shù)據(jù)庫。對于 Flink 而言，State 的外部使用可以分為在線的實時訪問和離線的訪問和修改，分別將由 Queryable State 和 Savepoint Processor API 兩個特性支持。

原文鏈接

本文為云棲社區(qū)原創(chuàng)內(nèi)容，未經(jīng)允許不得轉(zhuǎn)載。

向AI問一下細節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
mysql閃回工具binlog2sql
下一篇新聞：
DB2 V95 數(shù)據(jù)庫遷移升級至 V105 實戰(zhàn)案例

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

<strike id="qodjf"><menu id="qodjf"><samp id="qodjf"></samp></menu></strike>

<pre id="qodjf"></pre>