MySQL中的redo log和undo log日志有什么用

發(fā)布時(shí)間：2021-07-27 10:42:04 來源：億速云閱讀：171 作者：chen 欄目：開發(fā)技術(shù)

這篇文章主要介紹“MySQL中的redo log和undo log日志有什么用”，在日常操作中，相信很多人在MySQL中的redo log和undo log日志有什么用問題上存在疑惑，小編查閱了各式資料，整理出簡(jiǎn)單好用的操作方法，希望對(duì)大家解答”MySQL中的redo log和undo log日志有什么用”的疑惑有所幫助！接下來，請(qǐng)跟著小編一起來學(xué)習(xí)吧！

MySQL日志系統(tǒng)中最重要的日志為重做日志redo log和歸檔日志bin log，后者為MySQL Server層的日志，前者為InnoDB存儲(chǔ)引擎層的日志。

1 重做日志redo log

1.1 什么是redo log

redo log用于保證事務(wù)的持久性，即ACID中的D。

持久性：指一個(gè)事務(wù)一旦被提交，它對(duì)數(shù)據(jù)庫(kù)中數(shù)據(jù)的改變就是永久性的，接下來即使數(shù)據(jù)庫(kù)發(fā)生故障也不應(yīng)該對(duì)其有任何影響。

redo log有兩種類型，分別為物理重做日志和邏輯重做日志。在InnoDB中redo log大多數(shù)情況下是一個(gè)物理日志，記錄數(shù)據(jù)頁(yè)面的物理變化（實(shí)際的數(shù)據(jù)值）。

1.2 redo log的功能

redo log的主要功能是用于數(shù)據(jù)庫(kù)崩潰時(shí)的數(shù)據(jù)恢復(fù)。

1.3 redo log的組成

redo log可以分為以下兩部分

存儲(chǔ)在內(nèi)存中的重做日志緩沖區(qū)存儲(chǔ)在磁盤上的重做日志文件

MySQL中的redo log和undo log日志有什么用

1.4 記錄redo log的時(shí)機(jī)

在完成數(shù)據(jù)的修改之后，臟頁(yè)刷入磁盤之前寫入重做日志緩沖區(qū)。即先修改，再寫入。

臟頁(yè)：內(nèi)存中與磁盤上不一致的數(shù)據(jù)（并不是壞的?。?/p>

在以下情況下，redo log由重做日志緩沖區(qū)寫入磁盤上的重做日志文件。

redo log buffer的日志占據(jù)redo log buffer總?cè)萘康囊话霑r(shí)，將redo log寫入磁盤。
一個(gè)事務(wù)提交時(shí)，他的redo log都刷入磁盤，這樣可以保證數(shù)據(jù)絕不丟失（最常見的情況）。注意這時(shí)內(nèi)存中的臟頁(yè)可能尚未全部寫入磁盤。
后臺(tái)線程定時(shí)刷新，有一個(gè)后臺(tái)線程每過一秒就將redo log寫入磁盤。
MySQL關(guān)閉時(shí)，redo log都被寫入磁盤。

第一種情況和第四種情況一定會(huì)執(zhí)行redo log的寫入，第二種情況和第三種情況的執(zhí)行要根據(jù)參數(shù)innodb_flush_log_at_trx_commit的設(shè)定值，在下文會(huì)有詳細(xì)描述。

索引的創(chuàng)建也需要記錄redo log。

1.5 一個(gè)重做全過程的示例

MySQL中的redo log和undo log日志有什么用

以更新事務(wù)為例。

將原始數(shù)據(jù)讀入內(nèi)存，修改數(shù)據(jù)的內(nèi)存副本。
生成redo log并寫入重做日志緩沖區(qū)，redo log中存儲(chǔ)的是修改后的新值。
事務(wù)提交時(shí)，將重做日志緩沖區(qū)中的內(nèi)容刷新到重做日志文件。
隨后正常將內(nèi)存中的臟頁(yè)刷回磁盤。

1.6 持久性的保證

1.6.1 Force Log at Commit機(jī)制

Force Log at Commit機(jī)制實(shí)現(xiàn)了事務(wù)的持久性。在內(nèi)存中操作時(shí)，日志被寫入重做日志緩沖區(qū)。但在事務(wù)提交之前，必須首先將所有日志寫入磁盤上的重做日志文件。

為了確保每個(gè)日志都寫入重做日志文件，必須使用一個(gè)fsync系統(tǒng)調(diào)用，確保OS buffer中的日志被完整地寫入磁盤上的log file。

fsync系統(tǒng)調(diào)用：需要你在入?yún)⒌奈恢蒙蟼鬟f給他一個(gè)fd，然后系統(tǒng)調(diào)用就會(huì)對(duì)這個(gè)fd指向的文件起作用。fsync會(huì)確保一直到寫磁盤操作結(jié)束才會(huì)返回，所以當(dāng)你的程序使用這個(gè)函數(shù)并且它成功返回時(shí)，就說明數(shù)據(jù)肯定已經(jīng)安全的落盤了。所以fsync適合數(shù)據(jù)庫(kù)這種程序。

MySQL中的redo log和undo log日志有什么用

1.6.2 innodb_flush_log_at_trx_commit參數(shù)

InnoDB提供了一個(gè)參數(shù)innodb_flush_log_at_trx_commit控制日志刷新到磁盤的策略。

當(dāng)innodb_flush_log_at_trx_commit值為1時(shí)（默認(rèn)）。事務(wù)每次提交都必須將log buffer中的日志寫入os buffer并調(diào)用fsync()寫入磁盤中。

這種方式即使系統(tǒng)崩潰也不會(huì)丟失任何數(shù)據(jù)，但是因?yàn)槊看翁峤欢紝懭氪疟P，IO性能較差。

當(dāng)innodb_flush_log_at_trx_commit值為0時(shí)。事務(wù)提交時(shí)不將log buffer寫入到os buffer，而是每秒寫入os buffer并調(diào)用fsync()寫入到log file on disk中。

這實(shí)際上相當(dāng)于在內(nèi)存中維護(hù)了一個(gè)用戶設(shè)計(jì)的緩沖區(qū)，它減少了和os buffer之間的數(shù)據(jù)傳輸，有更好的性能。

每秒寫入磁盤，系統(tǒng)崩潰會(huì)丟失1s的數(shù)據(jù)。

當(dāng)innodb_flush_log_at_trx_commit值為2時(shí)。每次提交都僅寫入os buffer，然后每秒調(diào)用fsync()將os buffer中的日志寫入到log file on disk中。

雖然說我們是每秒調(diào)用fsync()將os buffer中的日志寫入到log file on disk中，但是平時(shí)即使不調(diào)用fsync，數(shù)據(jù)也會(huì)2自主地逐漸進(jìn)入磁盤。所以當(dāng)發(fā)生系統(tǒng)崩潰，相比第二種情況，會(huì)丟失較少的數(shù)據(jù)。

但同時(shí)，由于每次提交都寫入os buffer，所以相比第二種情況，性能會(huì)差一些，但還是比第一種好的。

無論是哪種情況

MySQL中的redo log和undo log日志有什么用

1.6.3 一個(gè)小的性能測(cè)試

幾個(gè)選項(xiàng)之間的性能差距是極大的，下面做一個(gè)簡(jiǎn)單的測(cè)試。

#創(chuàng)建測(cè)試表
drop table if exists test_flush_log;
create table test_flush_log(id int,name char(50))engine=innodb;

#創(chuàng)建插入指定行數(shù)的記錄到測(cè)試表中的存儲(chǔ)過程
drop procedure if exists proc;
delimiter $$
create procedure proc(i int)
begin
    declare s int default 1;
    declare c char(50) default repeat('a',50);
    while s<=i do
        start transaction;
        insert into test_flush_log values(null,c);
        commit;
        set s=s+1;
    end while;
end$$
delimiter ;

下面均插入十萬條記錄。

Ⅰ 當(dāng)innodb_flush_log_at_trx_commit值為1時(shí)

test> call proc(100000)
[2021-07-25 13:22:02] completed in 27 s 350 ms

需要長(zhǎng)達(dá)27.35s。

Ⅱ 當(dāng)innodb_flush_log_at_trx_commit值為2時(shí)

test> set @@global.innodb_flush_log_at_trx_commit=2;    
test> truncate test_flush_log;

test> call proc(100000)
[2021-07-25 13:27:33] completed in 5 s 774 ms

只需5.774s，性能大大提升。

Ⅲ 當(dāng)innodb_flush_log_at_trx_commit值為0時(shí)

test> set @@global.innodb_flush_log_at_trx_commit=0;
test> truncate test_flush_log;

test> call proc(100000)
[2021-07-25 13:30:34] completed in 3 s 537 ms

只需3.537s，性能更高。

顯然，innodb_flush_log_at_trx_commit值為1時(shí)性能差得非常明顯，改為0和2后性能都有大幅提升，其中0更快但相比2提升不大。

雖然改為0和2可以大幅提升性能，但會(huì)嚴(yán)重影響安全性。我們可以通過修改存儲(chǔ)過程，將事務(wù)的創(chuàng)建和提交放到循環(huán)外，統(tǒng)一提交，減少了IO頻率。

drop procedure if exists proc;
delimiter $$
create procedure proc(i int)
begin
    declare s int default 1;
    declare c char(50) default repeat('a',50);
    start transaction;
    while s<=i DO
        insert into test_flush_log values(null,c);
        set s=s+1;
    end while;
    commit;
end$$
delimiter ;

1.6.4 迷你事務(wù)mini-transaction

mini-trasaction是InnoDB處理小型事務(wù)時(shí)使用的一種機(jī)制，它可以確保并發(fā)事務(wù)操作和數(shù)據(jù)庫(kù)異常發(fā)生時(shí)，數(shù)據(jù)頁(yè)中的數(shù)據(jù)一致性。

迷你事務(wù)必須遵循下面三個(gè)協(xié)議：

FIX規(guī)則。寫時(shí)必須使用獨(dú)占鎖，讀時(shí)必須使用共享鎖。反正就是要鎖住。
預(yù)寫日志。預(yù)寫日志即WAL，Write-Ahead Log。持久化數(shù)據(jù)之前，必須先持久化內(nèi)存中的日志。每個(gè)頁(yè)面都有一個(gè)LSN（日志序列號(hào)）。在將數(shù)據(jù)寫入磁盤前，要先將內(nèi)存中序列號(hào)小于LSN的日志寫入磁盤。WAL提供三種持久化模式

最嚴(yán)格的是full-sync，fsync保證在返回之前將記錄刷新到磁盤，最大化了數(shù)據(jù)的安全性。

MySQL中的redo log和undo log日志有什么用

第二個(gè)級(jí)別是write-only，保證記錄寫入操作系統(tǒng)。這允許數(shù)據(jù)在進(jìn)程級(jí)別的崩潰后幸存。

MySQL中的redo log和undo log日志有什么用

最不嚴(yán)格的是no-sync，將記錄保存在內(nèi)存緩沖區(qū)中，不保證立即寫入文件系統(tǒng)。

MySQL中的redo log和undo log日志有什么用

強(qiáng)制日志再提交。即Force-log-at-commit，它要求提交事務(wù)時(shí)必須把所有迷你事務(wù)日志刷新到磁盤。

1.7 寫redo log的過程

MySQL中的redo log和undo log日志有什么用

如上圖，展示了redo log是如何被寫入log buffer的。每個(gè)mini-trasaction對(duì)應(yīng)于每個(gè)DML操作，例如更新語句等。

每個(gè)數(shù)據(jù)修改后被寫入迷你事務(wù)私有緩沖區(qū)。
當(dāng)更新語句完成，redo log從迷你事務(wù)私有緩沖區(qū)被寫入內(nèi)存中的公共日志緩沖區(qū)。
提交外部事務(wù)時(shí)，會(huì)將重做日志緩沖區(qū)刷入重做日志文件。

1.8 日志塊 log block

redo log以塊為單位進(jìn)行存儲(chǔ)，每個(gè)塊大小為512字節(jié)。無論是在內(nèi)存重做日志緩沖區(qū)、操作系統(tǒng)緩沖區(qū)還是重做日志文件中，都是以這樣的512字節(jié)大小的塊進(jìn)行存儲(chǔ)的。

MySQL中的redo log和undo log日志有什么用

每個(gè)日志塊頭由以下四個(gè)部分組成

log_block_hdr_no：(4字節(jié))該日志塊在redo log buffer中的位置ID。
log_block_hdr_data_len：(2字節(jié))該log block中已記錄的log大小。寫滿該log block時(shí)為0x200，表示512字節(jié)。
log_block_first_rec_group：(2字節(jié))該log block中第一個(gè)log的開始偏移位置。
lock_block_checkpoint_no：(4字節(jié))寫入檢查點(diǎn)信息的位置。

1.9 log group

log group代表redo log的分組，由多個(gè)大小相同的redo log file組成。由一個(gè)參數(shù)innodb_log_files_group決定，默認(rèn)為2。
[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜img-qAyaSeL3543740G:61311akw89MySQL[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-h01w68EG-1627284031849)(G:\markdown\MySQL\image-20210726131134489.png)].png)]

這個(gè)group是邏輯上的概念，但可以通過變量 innodb_log_group_home_dir 來定義組的目錄，redo log file都放在這個(gè)目錄下，默認(rèn)是在datadir下。

MySQL中的redo log和undo log日志有什么用

2 撤銷日志undo log

2.1 關(guān)于undo log

undo log存在的意義是確保數(shù)據(jù)庫(kù)事務(wù)的原子性。

原子性是指事務(wù)是一個(gè)不可分割的工作單位，事務(wù)中的操作要么都發(fā)生，要么都不發(fā)生。

edo log記錄了事務(wù)的行為，可以很好地保證一致性，對(duì)數(shù)據(jù)進(jìn)行“重做”操作。但事務(wù)有時(shí)還需要進(jìn)行“回滾”操作，這時(shí)就需要undo log。當(dāng)我們對(duì)記錄做了變更操作的時(shí)候就需要產(chǎn)生undo log，其中記錄的是老版本的數(shù)據(jù)，當(dāng)舊事務(wù)需要讀取數(shù)據(jù)時(shí)，可以順著undo鏈找到滿足其可見性地記錄。
undo log通常以邏輯日志的形式存在。我們可以認(rèn)為當(dāng)delete一條記錄時(shí)，undo log會(huì)產(chǎn)生一條對(duì)應(yīng)的insert記錄，反之亦然。當(dāng)update一條記錄時(shí)，會(huì)產(chǎn)生一條相反的update記錄。
undo log采用段segment的方式來記錄，每個(gè)undo操作在記錄的時(shí)候占用一個(gè)undo log segment。
undo log也會(huì)產(chǎn)生redo log，因?yàn)閡ndo log也要實(shí)現(xiàn)持久性保護(hù)。

undo log通常以邏輯日志的形式存在。我們可以認(rèn)為當(dāng)delete一條記錄時(shí)，undo log會(huì)產(chǎn)生一條對(duì)應(yīng)的insert記錄，反之亦然。當(dāng)update一條記錄時(shí)，會(huì)產(chǎn)生一條相反的update記錄。

undo log采用段segment的方式來記錄，每個(gè)undo操作在記錄的時(shí)候占用一個(gè)undo log segment。

undo log也會(huì)產(chǎn)生redo log，因?yàn)閡ndo log也要實(shí)現(xiàn)持久性保護(hù)。

2.2 undo log segment

為了保證事務(wù)并發(fā)操作時(shí)，寫各自的undo log時(shí)不發(fā)生沖突，nnodb用段的方式管理undo log。rollback segment稱為回滾段，每個(gè)回滾段中有1024個(gè)undo log segment。MySQL5.5以后的版本支持128個(gè)rollback segment，就可以存儲(chǔ)128*1024個(gè)操作，還可以通過innodb_undo_logs參數(shù)定義盯梢個(gè)rollback segment。

MySQL中的redo log和undo log日志有什么用

2.3 purge

在聚集索引列的操作中，MySQL是這樣設(shè)計(jì)的。對(duì)一條delete語句

delete from t where a = 1

假如a有聚集索引（主鍵），那么不會(huì)進(jìn)行真正的刪除，而是在主鍵列等于1的記錄處設(shè)置delete flag為1，即把記錄保存在B+樹中。同理，對(duì)于update操作，不是直接更新記錄，而是把舊紀(jì)錄標(biāo)識(shí)為刪除，再創(chuàng)建一條新記錄。

那么，舊版本記錄什么時(shí)候真正的刪除呢？

InnoDB使用undo日志進(jìn)行舊版本的刪除操作，這個(gè)操作稱為purge操作。InnoDB開辟了purge線程進(jìn)行purge操作，并且可以控制purge線程的數(shù)量，每個(gè)purge線程每10s 進(jìn)行一次purge操作。

InnoDB的undo log設(shè)計(jì)

一個(gè)頁(yè)上允許多個(gè)事務(wù)的undo log存在，undo log的存儲(chǔ)順序是隨時(shí)的。InnoDB維護(hù)了一個(gè)history鏈表，按照事務(wù)提交的順序?qū)ndo log進(jìn)行連接。

MySQL中的redo log和undo log日志有什么用

在執(zhí)行purge過程中，InnoDB存儲(chǔ)引擎首先從history list中找到第一個(gè)需要被清理的記錄，這里為trx1，清理之后InnoDB存儲(chǔ)引擎會(huì)在trx1所在的Undo page中繼續(xù)尋找是否存在可以被清理的記錄，這里會(huì)找到事務(wù)trx3，接著找到trx5，但是發(fā)現(xiàn)trx5被其他事務(wù)所引用而不能清理，故再去history list中取查找，發(fā)現(xiàn)最尾端的記錄時(shí)trx2，接著找到trx2所在的Undo page，依次把trx6、trx4清理，由于Undo page2中所有的記錄都被清理了，因此該Undo page可以進(jìn)行重用。

InnoDB存儲(chǔ)引擎這種先從history list中找undo log，然后再?gòu)腢ndo page中找undo log的設(shè)計(jì)模式是為了避免大量隨機(jī)讀操作，從而提高purge的效率。

3 InnoDB的恢復(fù)操作

3.1 數(shù)據(jù)頁(yè)刷盤的規(guī)則和checkpoint

內(nèi)存中(buffer pool)未刷到磁盤的數(shù)據(jù)稱為臟數(shù)據(jù)(dirty data)。由于數(shù)據(jù)和日志都以頁(yè)的形式存在，所以臟頁(yè)表示臟數(shù)據(jù)和臟日志。

在InnoDB中，checkpoint是數(shù)據(jù)刷盤的唯一規(guī)則。checkpoint觸發(fā)后，會(huì)將內(nèi)存中的臟數(shù)據(jù)刷到磁盤。

innodb存儲(chǔ)引擎中checkpoint分為兩種：

sharp checkpoint：在重用redo log文件(例如切換日志文件)的時(shí)候，將所有已記錄到redo log中對(duì)應(yīng)的臟數(shù)據(jù)刷到磁盤。
fuzzy checkpoint：一次只刷一小部分的日志到磁盤，而非將所有臟日志刷盤。有以下幾種情況會(huì)觸發(fā)該檢查點(diǎn)：

master thread checkpoint。由master線程控制，每秒或每10秒刷入一定比例的臟頁(yè)到磁盤。
flush_lru_list checkpoint。從MySQL5.6開始可通過 innodb_page_cleaners 變量指定專門負(fù)責(zé)臟頁(yè)刷盤的page cleaner線程的個(gè)數(shù)，該線程的目的是為了保證lru列表有可用的空閑頁(yè)。
async/sync flush checkpoint。同步刷盤還是異步刷盤。例如還有非常多的臟頁(yè)沒刷到磁盤(非常多是多少，有比例控制)，這時(shí)候會(huì)選擇同步刷到磁盤，但這很少出現(xiàn)；如果臟頁(yè)不是很多，可以選擇異步刷到磁盤，如果臟頁(yè)很少，可以暫時(shí)不刷臟頁(yè)到磁盤
dirty page too much checkpoint。臟頁(yè)太多時(shí)強(qiáng)制觸發(fā)檢查點(diǎn)，目的是為了保證緩存有足夠的空閑空間。too much的比例由變量 innodb_max_dirty_pages_pct 控制，MySQL 5.6默認(rèn)的值為75，即當(dāng)臟頁(yè)占緩沖池的百分之75后，就強(qiáng)制刷一部分臟頁(yè)到磁盤。

由于刷臟頁(yè)需要一定的時(shí)間來完成，所以記錄檢查點(diǎn)的位置是在每次刷盤結(jié)束之后才在redo log中標(biāo)記的。

3.2 LSN

3.2.1 LSN概念

LSN稱為日志的邏輯序列號(hào)，在InnoDB中占用8個(gè)字節(jié)

我們可以通過LSN了解到下面這些信息：

數(shù)據(jù)頁(yè)的版本信息。
寫入的日志總量。
檢查點(diǎn)的位置。

在下面兩個(gè)位置存在LSN：

redo log的記錄中。
每個(gè)數(shù)據(jù)頁(yè)的頭部有一個(gè)變量fil_page_lsn記錄了本頁(yè)最終的LSN值是多少。

顯然，如果頁(yè)中的LSN值小于redo log中的LSN值，說明數(shù)據(jù)出現(xiàn)了丟失。

通過show engine innodb status可以查看當(dāng)前InnoDB的運(yùn)行信息，其中有一欄log中有關(guān)于lsn的記錄。

MySQL中的redo log和undo log日志有什么用

log sequence number記錄了當(dāng)前的redo log(in buffer)中的LSN。
log flushed up to是刷到磁盤重做日志文件中的LSN。
pages flushed up to是已經(jīng)刷到磁盤數(shù)據(jù)頁(yè)上的LSN。
last checkpoint at是上一次檢查點(diǎn)所在位置的LSN。

3.2.2 LSN處理流程

(1).首先修改內(nèi)存中的數(shù)據(jù)頁(yè)，并在數(shù)據(jù)頁(yè)中記錄LSN，暫且稱之為data_in_buffer_lsn；

(2).并且在修改數(shù)據(jù)頁(yè)的同時(shí)(幾乎是同時(shí))向redo log in buffer中寫入redo log，并記錄下對(duì)應(yīng)的LSN，暫且稱之為redo_log_in_buffer_lsn；

(3).寫完buffer中的日志后，當(dāng)觸發(fā)了日志刷盤的幾種規(guī)則時(shí)，會(huì)向redo log file on disk刷入重做日志，并在該文件中記下對(duì)應(yīng)的LSN，暫且稱之為redo_log_on_disk_lsn；

(4).數(shù)據(jù)頁(yè)不可能永遠(yuǎn)只停留在內(nèi)存中，在某些情況下，會(huì)觸發(fā)checkpoint來將內(nèi)存中的臟頁(yè)(數(shù)據(jù)臟頁(yè)和日志臟頁(yè))刷到磁盤，所以會(huì)在本次checkpoint臟頁(yè)刷盤結(jié)束時(shí)，在redo log中記錄checkpoint的LSN位置，暫且稱之為checkpoint_lsn。

(5).要記錄checkpoint所在位置很快，只需簡(jiǎn)單的設(shè)置一個(gè)標(biāo)志即可，但是刷數(shù)據(jù)頁(yè)并不一定很快，例如這一次checkpoint要刷入的數(shù)據(jù)頁(yè)非常多。也就是說要刷入所有的數(shù)據(jù)頁(yè)需要一定的時(shí)間來完成，中途刷入的每個(gè)數(shù)據(jù)頁(yè)都會(huì)記下當(dāng)前頁(yè)所在的LSN，暫且稱之為data_page_on_disk_lsn。

MySQL中的redo log和undo log日志有什么用

上圖中，從上到下的橫線分別代表：時(shí)間軸、buffer中數(shù)據(jù)頁(yè)中記錄的LSN(data_in_buffer_lsn)、磁盤中數(shù)據(jù)頁(yè)中記錄的LSN(data_page_on_disk_lsn)、buffer中重做日志記錄的LSN(redo_log_in_buffer_lsn)、磁盤中重做日志文件中記錄的LSN(redo_log_on_disk_lsn)以及檢查點(diǎn)記錄的LSN(checkpoint_lsn)。

假設(shè)在最初時(shí)(12:0:00)所有的日志頁(yè)和數(shù)據(jù)頁(yè)都完成了刷盤，也記錄好了檢查點(diǎn)的LSN，這時(shí)它們的LSN都是完全一致的。

假設(shè)此時(shí)開啟了一個(gè)事務(wù)，并立刻執(zhí)行了一個(gè)update操作，執(zhí)行完成后，buffer中的數(shù)據(jù)頁(yè)和redo log都記錄好了更新后的LSN值，假設(shè)為110。這時(shí)候如果執(zhí)行 show engine innodb status 查看各LSN的值，即圖中①處的位置狀態(tài)，結(jié)果會(huì)是：

log sequence number(110) > log flushed up to(100) = pages flushed up to = last checkpoint at

之后又執(zhí)行了一個(gè)delete語句，LSN增長(zhǎng)到150。等到12:00:01時(shí)，觸發(fā)redo log刷盤的規(guī)則(其中有一個(gè)規(guī)則是 innodb_flush_log_at_timeout 控制的默認(rèn)日志刷盤頻率為1秒)，這時(shí)redo log file on disk中的LSN會(huì)更新到和redo log in buffer的LSN一樣，所以都等于150，這時(shí) show engine innodb status ，即圖中②的位置，結(jié)果將會(huì)是：

log sequence number(150) = log flushed up to > pages flushed up to(100) = last checkpoint at

再之后，執(zhí)行了一個(gè)update語句，緩存中的LSN將增長(zhǎng)到300，即圖中③的位置。

假設(shè)隨后檢查點(diǎn)出現(xiàn)，即圖中④的位置，正如前面所說，檢查點(diǎn)會(huì)觸發(fā)數(shù)據(jù)頁(yè)和日志頁(yè)刷盤，但需要一定的時(shí)間來完成，所以在數(shù)據(jù)頁(yè)刷盤還未完成時(shí)，檢查點(diǎn)的LSN還是上一次檢查點(diǎn)的LSN，但此時(shí)磁盤上數(shù)據(jù)頁(yè)和日志頁(yè)的LSN已經(jīng)增長(zhǎng)了，即：

log sequence number > log flushed up to 和 pages flushed up to > last checkpoint at

但是log flushed up to和pages flushed up to的大小無法確定，因?yàn)槿罩舅⒈P可能快于數(shù)據(jù)刷盤，也可能等于，還可能是慢于。但是checkpoint機(jī)制有保護(hù)數(shù)據(jù)刷盤速度是慢于日志刷盤的：當(dāng)數(shù)據(jù)刷盤速度超過日志刷盤時(shí)，將會(huì)暫時(shí)停止數(shù)據(jù)刷盤，等待日志刷盤進(jìn)度超過數(shù)據(jù)刷盤。

等到數(shù)據(jù)頁(yè)和日志頁(yè)刷盤完畢，即到了位置⑤的時(shí)候，所有的LSN都等于300。

隨著時(shí)間的推移到了12:00:02，即圖中位置⑥，又觸發(fā)了日志刷盤的規(guī)則，但此時(shí)buffer中的日志LSN和磁盤中的日志LSN是一致的，所以不執(zhí)行日志刷盤，即此時(shí) show engine innodb status 時(shí)各種lsn都相等。

隨后執(zhí)行了一個(gè)insert語句，假設(shè)buffer中的LSN增長(zhǎng)到了800，即圖中位置⑦。此時(shí)各種LSN的大小和位置①時(shí)一樣。

隨后執(zhí)行了提交動(dòng)作，即位置⑧。默認(rèn)情況下，提交動(dòng)作會(huì)觸發(fā)日志刷盤，但不會(huì)觸發(fā)數(shù)據(jù)刷盤，所以 show engine innodb status 的結(jié)果是：

log sequence number = log flushed up to > pages flushed up to = last checkpoint at

最后隨著時(shí)間的推移，檢查點(diǎn)再次出現(xiàn)，即圖中位置⑨。但是這次檢查點(diǎn)不會(huì)觸發(fā)日志刷盤，因?yàn)槿罩镜腖SN在檢查點(diǎn)出現(xiàn)之前已經(jīng)同步了。假設(shè)這次數(shù)據(jù)刷盤速度極快，快到一瞬間內(nèi)完成而無法捕捉到狀態(tài)的變化，這時(shí) show engine innodb status 的結(jié)果將是各種LSN相等。

3.3 InnoDB的恢復(fù)行為

啟動(dòng)InnoDB時(shí)，一定會(huì)進(jìn)行恢復(fù)操作，無論上次是因?yàn)槭裁丛蛲顺觥?/p>

checkpoint表示已經(jīng)完整刷到磁盤上data page上的LSN，因此恢復(fù)時(shí)僅需要恢復(fù)從checkpoint開始的日志部分。例如，當(dāng)數(shù)據(jù)庫(kù)在上一次checkpoint的LSN為10000時(shí)宕機(jī)，且事務(wù)是已經(jīng)提交過的狀態(tài)。啟動(dòng)數(shù)據(jù)庫(kù)時(shí)會(huì)檢查磁盤中數(shù)據(jù)頁(yè)的LSN，如果數(shù)據(jù)頁(yè)的LSN小于日志中的LSN，則會(huì)從檢查點(diǎn)開始恢復(fù)。

還有一種情況，在宕機(jī)前正處于checkpoint的刷盤過程，且數(shù)據(jù)頁(yè)的刷盤進(jìn)度超過了日志頁(yè)的刷盤進(jìn)度。這時(shí)候一宕機(jī)，數(shù)據(jù)頁(yè)中記錄的LSN就會(huì)大于日志頁(yè)中的LSN，在重啟的恢復(fù)過程中會(huì)檢查到這一情況，這時(shí)超出日志進(jìn)度的部分將不會(huì)重做，因?yàn)檫@本身就表示已經(jīng)做過的事情，無需再重做。

另外，事務(wù)日志具有冪等性，所以多次操作得到同一結(jié)果的行為在日志中只記錄一次。而二進(jìn)制日志不具有冪等性，多次操作會(huì)全部記錄下來，在恢復(fù)的時(shí)候會(huì)多次執(zhí)行二進(jìn)制日志中的記錄，速度就慢得多。例如，某記錄中id初始值為2，通過update將值設(shè)置為了3，后來又設(shè)置成了2，在事務(wù)日志中記錄的將是無變化的頁(yè)，根本無需恢復(fù)；而二進(jìn)制會(huì)記錄下兩次update操作，恢復(fù)時(shí)也將執(zhí)行這兩次update操作，速度比事務(wù)日志恢復(fù)更慢。

到此，關(guān)于“MySQL中的redo log和undo log日志有什么用”的學(xué)習(xí)就結(jié)束了，希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí)，快去試試吧！若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí)，請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站，小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章！

向AI問一下細(xì)節(jié)

MySQL中的redo log和undo log日志有什么用

1 重做日志redo log

1.1 什么是redo log

1.2 redo log的功能

1.3 redo log的組成

1.4 記錄redo log的時(shí)機(jī)

1.5 一個(gè)重做全過程的示例

1.6 持久性的保證

1.7 寫redo log的過程

1.8 日志塊 log block

1.9 log group

2.2 undo log segment

2.3 purge

3 InnoDB的恢復(fù)操作

3.1 數(shù)據(jù)頁(yè)刷盤的規(guī)則和checkpoint

3.2 LSN

3.3 InnoDB的恢復(fù)行為

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽