溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

大并發(fā)熱點行更新的兩個騷操作

發(fā)布時間:2020-02-26 09:23:02 來源:網(wǎng)絡 閱讀:762 作者:王清培 欄目:MySQL數(shù)據(jù)庫

大并發(fā)熱點行更新的兩個騷操作

標簽:insert_slot select..for_update rand

要想db操作的性能足夠高,巧妙的設計很重要,事務的操作范圍要盡量的小。一般情況下我們都是使用某個orm框架來操作db,這一類框架多數(shù)的實現(xiàn)方式都是夸網(wǎng)絡多次交互來開啟事務上下文和執(zhí)行sql操作,是個黑盒子,包括對 autocommit 設置的時機也會有一些差異,稍微不注意就會踩坑。

在大并發(fā)的情況下加上夸網(wǎng)絡多次交互,就不可避免的由于網(wǎng)絡延遲、丟包等原因?qū)е率聞盏膱?zhí)行時間過長,出現(xiàn)雪崩概率會大大增加。建議在性能和并發(fā)要求比較高的場景下盡量少用orm,如果非要用盡量控制好事務的范圍和執(zhí)行時間。

大并發(fā)db操作的原則就是事務操作盡量少跨網(wǎng)絡交互,一旦跨網(wǎng)絡使用事務盡量用樂觀鎖來解決,少用悲觀鎖,盡量縮短當前 session 持有鎖的時間。

下面分享兩個在mysql innodb engine 上的大并發(fā)更新行的騷操作,這兩個騷操作都是盡可能的縮小db鎖的范圍和時間。

轉(zhuǎn)化update為insert

比較常見的大并發(fā)場景之一就是熱點數(shù)據(jù)的 update,比如具有預算類的庫存、賬戶等。

update從原理上需要innodb engine 先獲取row數(shù)據(jù),然后進行row format轉(zhuǎn)換到mysql服務層,再通過mysql服務器層進行數(shù)據(jù)修改,最后再通過innodb engine寫回。

這整個過程每一個環(huán)節(jié)都有一定的開銷,首先需要一次innodb查詢,然后需要一次row format(如果row比較寬的話性能損失還是比較大的),最后還需要一次更新和一次寫入,大概需要四個小階段。

一次update就需要上述四過程開銷。此時如果qps非常大,必然會有一定性能開銷(這里暫不考慮cache、mq之類的削峰)。那么我們能不能將單個行的熱點分散開來,同時將update轉(zhuǎn)換成insert,我們來看下如何騷操作。

我們引入 slot 概念,原來一個row 我們通過多個row來表示,結(jié)果通過sum來匯總。為了不讓slot成為瓶頸,我們 rand slot,然后將update轉(zhuǎn)換成insert,通過 on duplicate key update 子句來解決沖突問題。

我們創(chuàng)建一個sku庫存表。

CREATE TABLE `tb_sku_stock` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `sku_id` bigint(20) NOT NULL,
  `sku_stock` int(11) DEFAULT '0',
  `slot` int(11) NOT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `idx_sku_slot` (`sku_id`,`slot`),
  KEY `idx_sku_id` (`sku_id`)
) ENGINE=InnoDB AUTO_INCREMENT=30 DEFAULT CHARSET=utf8mb4

表中唯一性索引 idx_sku_slot 用來約束同一個 sku_id 不同 slot 。

庫存增加操作和減少操作要分開來處理,我們先看增加操作。

insert into tb_sku_stock (sku_id,sku_stock,slot)
values(101010101, 10, round(rand()*9)+1) 
on  duplicate key update sku_stock=sku_stock+values(sku_stock)

我們給 sku_id=101010101 增加10個庫存,通過 round(rand()*9)+1 將slot控制在10個以內(nèi)(可以根據(jù)情況放寬或縮小),當 unique key 不沖突的話就一直是insert,一旦發(fā)生 duplicate 就會執(zhí)行 update。(update也是分散的)

我們來看下減少庫存,減少庫存沒有增加庫存那么簡單,最大的問題是要做前置檢查,不能超扣。

我們先看庫存總數(shù)檢查,比如我們扣減10個庫存數(shù)。

select sku_id, sum(sku_stock) as ss
from tb_sku_stock
where sku_id= 101010101
group by sku_id having ss>= 10 for update

mysql的查詢是使用mvcc來實現(xiàn)無鎖并發(fā),所以為了實時一致性我們需要加上for update來做實時檢查。
如果庫存是夠扣減的話我們就執(zhí)行 insert into select 插入操作。

insert into tb_sku_stock (sku_id, sku_stock, slot)
select sku_id,-10 as sku_stock,round(rand() *9+ 1)
from(
    select sku_id, sum(sku_stock) as ss
    from tb_sku_stock
    where sku_id= 101010101
    group by sku_id having ss>= 10 for update) as tmp
on duplicate key update sku_stock= sku_stock+ values(sku_stock)

整個操作都是在一次db交互中執(zhí)行完成,如果控制好單表的數(shù)據(jù)量加上 unique key 配合性能是非常高的。

消除 select...for update

大型OLTP系統(tǒng),都會有一些需要周期性執(zhí)行的任務,比如定期結(jié)算的訂單、定期取消的協(xié)議等,還有很多兜底的檢查、對賬程序等都會檢查一定時間范圍內(nèi)的狀態(tài)數(shù)據(jù),這些任務一般都需要掃描表里的某個狀態(tài)字段。

這些查詢基本基于類似status狀態(tài)字段,由于區(qū)分度非常低,所以索引基本上在這類場景下沒有太大作用。

為了保證掃描出來的數(shù)據(jù)不會發(fā)生并發(fā)重復執(zhí)行的問題會對數(shù)據(jù)加排他鎖,通常就是 select...for update ,那么這部分數(shù)據(jù)就不會被重復讀取到。但是也就意味著當前db線程將block在此鎖上,就是一個串行操作。

由于是排他鎖,數(shù)據(jù)的 insert、update 都會受到影響,在 repeatable read (可重復讀)且沒有 unqiue key 的場合下還會觸發(fā)Gap lock(間隙鎖)。

我們可以通過一個方式來消除 select...for update,并且提高數(shù)據(jù)并發(fā)處理能力。

CREATE TABLE `tb_order` (
  `id` bigint(20) unsigned NOT NULL AUTO_INCREMENT,
  `order_id` bigint(20) NOT NULL,
  `order_status` int(11) NOT NULL DEFAULT '0',
  `task_id` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

我們簡單創(chuàng)建一個訂單表,task_id 是任務id,先讓數(shù)據(jù)結(jié)構支持多任務并行。

select order_id from tb_order where order_status=0 limit 10 for update

一般做法是通過select...for update 鎖住行。我們換個方法實現(xiàn)同樣的效果同時不會存在并發(fā)執(zhí)行問題。

update tb_order set task_id=10 where order_status=0 limit 10;
Query OK, 4 rows affected
select order_id from tb_order where task_id=10 limit 4;

假設我們當前有很多并行任務(1-10),假設task_id=10任務執(zhí)行,先update搶占自己的數(shù)據(jù)行。這個操作基本上在單數(shù)ms內(nèi),然后再通過select 帶上自己的taskid獲取到屬于當前task的行,同時可以帶上準確的limit,因為update是會返回受影響行數(shù)。

這里會有一個問題,就是執(zhí)行的task如果由于某個原因終止了怎么辦,簡單方法就是用一個兜底job定期檢查超過一定時間的task,然后將task_id置為空。

作者:王清培(趣頭條 Tech Leader)

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI