溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

關(guān)于MySQL死鎖問題的深入分析

發(fā)布時間:2020-09-04 17:20:46 來源:腳本之家 閱讀:196 作者:小孩子4919 欄目:MySQL數(shù)據(jù)庫

前言

如果我們的業(yè)務(wù)處在一個非常初級的階段,并發(fā)程度比較低,那么我們可以幾年都遇不到一次死鎖問題的發(fā)生,反之,我們業(yè)務(wù)的并發(fā)程度非常高,那么時不時爆出的死鎖問題肯定讓我們非常撓頭。不過在死鎖問題發(fā)生時,很多沒有經(jīng)驗的同學的第一反應就是成為一只鴕鳥:這玩意兒很高深,我也看不懂,聽天由命吧,又不是一直發(fā)生。其實如果大家認真研讀了我們之前寫的3篇關(guān)于MySQL中語句加鎖分析的文章,加上本篇關(guān)于死鎖日志的分析,那么解決死鎖問題應該也不是那么摸不著頭腦的事情了。

準備工作

為了故事的順利發(fā)展,我們需要建一個表:

CREATE TABLE hero (
 id INT,
 name VARCHAR(100),
 country varchar(100),
 PRIMARY KEY (id),
 KEY idx_name (name)
) Engine=InnoDB CHARSET=utf8;

我們?yōu)閔ero表的id列創(chuàng)建了聚簇索引,為name列創(chuàng)建了一個二級索引。這個hero表主要是為了存儲三國時的一些英雄,我們向表中插入一些記錄:

INSERT INTO hero VALUES
 (1, 'l劉備', '蜀'),
 (3, 'z諸葛亮', '蜀'),
 (8, 'c曹操', '魏'),
 (15, 'x荀彧', '魏'),
 (20, 's孫權(quán)', '吳');

現(xiàn)在表中的數(shù)據(jù)就是這樣的:

mysql> SELECT * FROM hero;
+----+------------+---------+
| id | name | country |
+----+------------+---------+
| 1 | l劉備 | 蜀 |
| 3 | z諸葛亮 | 蜀 |
| 8 | c曹操 | 魏 |
| 15 | x荀彧 | 魏 |
| 20 | s孫權(quán) | 吳 |
+----+------------+---------+
5 rows in set (0.00 sec)

準備工作就做完了。

創(chuàng)建死鎖情景

我們先創(chuàng)建一個發(fā)生死鎖的情景,在Session A和Session B中分別執(zhí)行兩個事務(wù),具體情況如下:

關(guān)于MySQL死鎖問題的深入分析

我們分析一下:

  • 從第③步中可以看出,Session A中的事務(wù)先對hero表聚簇索引的id值為1的記錄加了一個X型正經(jīng)記錄鎖。
  • 從第④步中可以看出,Session B中的事務(wù)對hero表聚簇索引的id值為3的記錄加了一個X型正經(jīng)記錄鎖。
  • 從第⑤步中可以看出,Session A中的事務(wù)接著想對hero表聚簇索引的id值為3的記錄也加了一個X型正經(jīng)記錄鎖,但是與第④步中Session B中的事務(wù)加的鎖沖突,所以Session A進入阻塞狀態(tài),等待獲取鎖。
  • 從第⑥步中可以看出,Session B中的事務(wù)想對hero表聚簇索引的id值為1的記錄加了一個X型正經(jīng)記錄鎖,但是與第③步中Session A中的事務(wù)加的鎖沖突,而此時Session A和Session B中的事務(wù)循環(huán)等待對方持有的鎖,死鎖發(fā)生,被MySQL服務(wù)器的死鎖檢測機制檢測到了,所以選擇了一個事務(wù)進行回滾,并向客戶端發(fā)送一條消息:

ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction

以上是我們從語句加了什么鎖的角度出發(fā)來進行死鎖情況分析的,但是實際應用中我們可能壓根兒不知道到底是哪幾條語句產(chǎn)生了死鎖,我們需要根據(jù)MySQL在死鎖發(fā)生時產(chǎn)生的死鎖日志來逆向定位一下到底是什么語句產(chǎn)生了死鎖,從而再優(yōu)化我們的業(yè)務(wù)。

查看死鎖日志

設(shè)計InnoDB的大叔給我們提供了SHOW ENGINE INNODB STATUS命令來查看關(guān)于InnoDB存儲引擎的一些狀態(tài)信息,其中就包括了系統(tǒng)最近一次發(fā)生死鎖時的加鎖情況。在上邊例子中的死鎖發(fā)生時,我們運行一下這個命令:

mysql> SHOW ENGINE INNODB STATUS\G
...省略了好多其他信息
------------------------
LATEST DETECTED DEADLOCK
------------------------
2019-06-20 13:39:19 0x70000697e000
*** (1) TRANSACTION:
TRANSACTION 30477, ACTIVE 10 sec starting index read
mysql tables in use 1, locked 1
LOCK WAIT 3 lock struct(s), heap size 1160, 2 row lock(s)
MySQL thread id 2, OS thread handle 123145412648960, query id 46 localhost 127.0.0.1 root statistics
select * from hero where id = 3 for update
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 171 page no 3 n bits 72 index PRIMARY of table `dahaizi`.`hero` trx id 30477 lock_mode X locks rec but not gap waiting
Record lock, heap no 3 PHYSICAL RECORD: n_fields 5; compact format; info bits 0
 0: len 4; hex 80000003; asc  ;;
 1: len 6; hex 000000007517; asc  u ;;
 2: len 7; hex 80000001d0011d; asc  ;;
 3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;
 4: len 3; hex e89c80; asc ;;

*** (2) TRANSACTION:
TRANSACTION 30478, ACTIVE 8 sec starting index read
mysql tables in use 1, locked 1
3 lock struct(s), heap size 1160, 2 row lock(s)
MySQL thread id 3, OS thread handle 123145412927488, query id 47 localhost 127.0.0.1 root statistics
select * from hero where id = 1 for update
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 171 page no 3 n bits 72 index PRIMARY of table `dahaizi`.`hero` trx id 30478 lock_mode X locks rec but not gap
Record lock, heap no 3 PHYSICAL RECORD: n_fields 5; compact format; info bits 0
 0: len 4; hex 80000003; asc  ;;
 1: len 6; hex 000000007517; asc  u ;;
 2: len 7; hex 80000001d0011d; asc  ;;
 3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;
 4: len 3; hex e89c80; asc ;;

*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 171 page no 3 n bits 72 index PRIMARY of table `dahaizi`.`hero` trx id 30478 lock_mode X locks rec but not gap waiting
Record lock, heap no 2 PHYSICAL RECORD: n_fields 5; compact format; info bits 0
 0: len 4; hex 80000001; asc  ;;
 1: len 6; hex 000000007517; asc  u ;;
 2: len 7; hex 80000001d00110; asc  ;;
 3: len 7; hex 6ce58898e5a487; asc l  ;;
 4: len 3; hex e89c80; asc ;;

*** WE ROLL BACK TRANSACTION (2)
------------
...省略了好多其他信息

我們只關(guān)心最近發(fā)生的死鎖信息,所以就把以LATEST DETECTED DEADLOCK這一部分給單獨提出來分析一下。下邊我們就逐行看一下這個輸出的死鎖日志都是什么意思:

首先看第一句:

2019-06-20 13:39:19 0x70000697e000

這句話的意思就是死鎖發(fā)生的時間是:2019-06-20 13:39:19,后邊的一串十六進制0x70000697e000表示的操作系統(tǒng)為當前session分配的線程的線程id。

然后是關(guān)于死鎖發(fā)生時第一個事務(wù)的有關(guān)信息:

*** (1) TRANSACTION:

# 為事務(wù)分配的id為30477,事務(wù)處于ACTIVE狀態(tài)已經(jīng)10秒了,事務(wù)現(xiàn)在正在做的操作就是:“starting index read”
TRANSACTION 30477, ACTIVE 10 sec starting index read

# 此事務(wù)使用了1個表,為1個表上了鎖(此處不是說為該表加了表鎖,只要不是進行一致性讀的表,都需要加鎖,具體怎么加鎖請看加鎖語句分析或者小冊章節(jié))
mysql tables in use 1, locked 1

# 此事務(wù)處于LOCK WAIT狀態(tài),擁有3個鎖結(jié)構(gòu)(2個行鎖結(jié)構(gòu),1個表級別X型意向鎖結(jié)構(gòu),鎖結(jié)構(gòu)在小冊中重點介紹過),heap size是為了存儲鎖結(jié)構(gòu)而申請的內(nèi)存大?。ㄎ覀兛梢院雎裕?,其中有2個行鎖的結(jié)構(gòu)
LOCK WAIT 3 lock struct(s), heap size 1160, 2 row lock(s)

# 本事務(wù)所在線程的id是2(MySQL自己命名的線程id),該線程在操作系統(tǒng)級別的id就是那一長串數(shù)字,當前查詢的id為46(MySQL內(nèi)部使用,可以忽略),還有用戶名主機信息
MySQL thread id 2, OS thread handle 123145412648960, query id 46 localhost 127.0.0.1 root statistics

# 本事務(wù)發(fā)生阻塞的語句
select * from hero where id = 3 for update

# 本事務(wù)當前在等待獲取的鎖:
*** (1) WAITING FOR THIS LOCK TO BE GRANTED:

# 等待獲取的表空間ID為151,頁號為3,也就是表hero的PRIMAY索引中的某條記錄的鎖(n_bits是為了存儲本頁面的鎖信息而分配的一串內(nèi)存空間,小冊中有詳細介紹),該鎖的類型是X型正經(jīng)記錄鎖(rec but not gap)
RECORD LOCKS space id 171 page no 3 n bits 72 index PRIMARY of table `dahaizi`.`hero` trx id 30477 lock_mode X locks rec but not gap waiting

# 該記錄在頁面中的heap_no為2,具體的記錄信息如下:
Record lock, heap no 3 PHYSICAL RECORD: n_fields 5; compact format; info bits 0

# 這是主鍵值
0: len 4; hex 80000003; asc  ;;

# 這是trx_id隱藏列
1: len 6; hex 000000007517; asc  u ;;

# 這是roll_pointer隱藏列
2: len 7; hex 80000001d0011d; asc  ;;

# 這是name列
3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;

# 這是country列
4: len 3; hex e89c80; asc ;;

從這個信息中可以看出,Session A中的事務(wù)為2條記錄生成了鎖結(jié)構(gòu),但是其中有一條記錄上的X型正經(jīng)記錄鎖(rec but not gap)并沒有獲取到,沒有獲取到鎖的這條記錄的位置是:表空間ID為151,頁號為3,heap_no為2。當然,設(shè)計InnoDB的大叔還貼心的給出了這條記錄的詳細情況,它的主鍵值為80000003,這其實是InnoDB內(nèi)部存儲使用的格式,其實就代表數(shù)字3,也就是該事務(wù)在等待獲取hero表聚簇索引主鍵值為3的那條記錄的X型正經(jīng)記錄鎖。

然后是關(guān)于死鎖發(fā)生時第二個事務(wù)的有關(guān)信息:

其中的大部分信息我們都已經(jīng)介紹過了,我們就挑重要的說:

*** (2) TRANSACTION:
TRANSACTION 30478, ACTIVE 8 sec starting index read
mysql tables in use 1, locked 1
3 lock struct(s), heap size 1160, 2 row lock(s)
MySQL thread id 3, OS thread handle 123145412927488, query id 47 localhost 127.0.0.1 root statistics
select * from hero where id = 1 for update

# 表示該事務(wù)獲取到的鎖信息
*** (2) HOLDS THE LOCK(S):
RECORD LOCKS space id 171 page no 3 n bits 72 index PRIMARY of table `dahaizi`.`hero` trx id 30478 lock_mode X locks rec but not gap
Record lock, heap no 3 PHYSICAL RECORD: n_fields 5; compact format; info bits 0

# 主鍵值為3
0: len 4; hex 80000003; asc  ;;
1: len 6; hex 000000007517; asc  u ;;
2: len 7; hex 80000001d0011d; asc  ;;
3: len 10; hex 7ae8afb8e8919be4baae; asc z   ;;
4: len 3; hex e89c80; asc ;;

# 表示該事務(wù)等待獲取的鎖信息
*** (2) WAITING FOR THIS LOCK TO BE GRANTED:
RECORD LOCKS space id 171 page no 3 n bits 72 index PRIMARY of table `dahaizi`.`hero` trx id 30478 lock_mode X locks rec but not gap waiting
Record lock, heap no 2 PHYSICAL RECORD: n_fields 5; compact format; info bits 0

# 主鍵值為1
0: len 4; hex 80000001; asc  ;;
1: len 6; hex 000000007517; asc  u ;;
2: len 7; hex 80000001d00110; asc  ;;
3: len 7; hex 6ce58898e5a487; asc l  ;;
4: len 3; hex e89c80; asc ;;

從上邊的輸出可以看出來,Session B中的事務(wù)獲取了hero表聚簇索引主鍵值為3的記錄的X型正經(jīng)記錄鎖,等待獲取hero表聚簇索引主鍵值為1的記錄的X型正經(jīng)記錄鎖(隱含的意思就是這個hero表聚簇索引主鍵值為1的記錄的X型正經(jīng)記錄鎖已經(jīng)被SESSION A中的事務(wù)獲取到了)。

看最后一部分:

*** WE ROLL BACK TRANSACTION (2)

最終InnoDB存儲引擎決定回滾第2個事務(wù),也就是Session B中的那個事務(wù)。

死鎖分析的思路

1、查看死鎖日志時,首先看一下發(fā)生死鎖的事務(wù)等待獲取鎖的語句都是啥。

本例中,發(fā)現(xiàn)SESSION A發(fā)生阻塞的語句是:

select * from hero where id = 3 for update

SESSION B發(fā)生阻塞的語句是:

select * from hero where id = 1 for update

然后切記:到自己的業(yè)務(wù)代碼中找出這兩條語句所在事務(wù)的其他語句。

2、找到發(fā)生死鎖的事務(wù)中所有的語句之后,對照著事務(wù)獲取到的鎖和正在等待的鎖的信息來分析死鎖發(fā)生過程。

從死鎖日志中可以看出來,SESSION A獲取了hero表聚簇索引id值為1的記錄的X型正經(jīng)記錄鎖(這其實是從SESSION B正在等待的鎖中獲取的),查看SESSION A中的語句,發(fā)現(xiàn)是下邊這個語句造成的(對照著語句加鎖分析那三篇文章):

select * from hero where id = 1 for update;

還有SESSION B獲取了hero表聚簇索引id值為3的記錄的X型正經(jīng)記錄鎖,查看SESSION B中的語句,發(fā)現(xiàn)是下邊這個語句造成的(對照著語句加鎖分析那三篇文章):

select * from hero where id = 3 for update;

然后看SESSION A正在等待hero表聚簇索引id值為3的記錄的X型正經(jīng)記錄鎖,這個是由于下邊這個語句造成的:

select * from hero where id = 3 for update;

然后看SESSION B正在等待hero表聚簇索引id值為1的記錄的X型正經(jīng)記錄鎖,這個是由于下邊這個語句造成的:

select * from hero where id = 1 for update;

然后整個死鎖形成過程就根據(jù)死鎖日志給還原出來了。

總結(jié)

以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對億速云的支持。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI