您好,登錄后才能下訂單哦!
今天就跟大家聊聊有關MySQL刪除數(shù)據(jù)表文件大小不變的原因是什么,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。
對于運行很長時間的數(shù)據(jù)庫來說,往往會出現(xiàn)表占用存儲空間過大的問題,可是將許多沒用的表刪除之后,表文件的大小并沒有改變,想解決這個問題,就需要了解 InnoDB 如何回收表空間的。
對于一張表來說,占用空間重要分為兩部分,表結構和表數(shù)據(jù)。通常來說,表結構定義占用的空間很小。所以空間的問題主要和表數(shù)據(jù)有關。
在 MySQL 8.0 前,表結構存儲在以 .frm 為后綴的文件里。在 8.0,允許將表結構定義在系統(tǒng)數(shù)據(jù)表中。
關于表數(shù)據(jù)的存放
可以將表數(shù)據(jù)存在共享表空間,或者單獨的文件中,通過 innodb_file_per_table
來控制。
在 5.6.6 以后,默認值為 ON.
建議將該參數(shù)設置為 ON,這樣在不需要時,通過 drop table 命令,系統(tǒng)就會直接刪除該文件。
但在共享表空間中,即使表刪掉,空間也不會回收。
truncate = drop + create
數(shù)據(jù)刪除流程
但有時使用 delete
刪除數(shù)據(jù)時,僅僅刪除的是某些行,但這可能就會出現(xiàn)表空間沒有被回收的情況。
我們知道,MySQL InnoDB 中采用了 B+ 樹作為存儲數(shù)據(jù)的結構,也就是常說的索引組織表,并且數(shù)據(jù)時按照頁來存儲的。
在刪除數(shù)據(jù)時,會有兩種情況:
比如想要刪除 R4 這條記錄:
InnoDB 直接將 R4 這條記錄標記為刪除,稱為可復用的位置。如果之后要插入 ID 在 300 到 700 間的記錄時,就會復用該位置。由此可見,磁盤文件的大小并不會減少。
而且記錄的復用,只限于符合范圍條件的數(shù)據(jù)。之后要插入 ID 為 800 的記錄,R4 的位置就不能被復用了。
再比如要是刪除了整個數(shù)據(jù)頁的內(nèi)容,假設刪除 R3 R4 R5,為 Page A 數(shù)據(jù)頁。
這時 InnoDB 就會將整個 Page A 標記為刪除狀態(tài),之后整個數(shù)據(jù)都可以被復用,沒有范圍的限制。比如要插入 ID=50 的內(nèi)容就可以直接復用。
并且如果兩個相鄰的數(shù)據(jù)頁利用率都很小,就會把兩個頁中的數(shù)據(jù)合到其中一個頁上,另一個頁標記為可復用。
綜上,無論是數(shù)據(jù)行的刪除還是數(shù)據(jù)頁的刪除,都是將其標記為刪除的狀態(tài),用于復用,所以文件并不會減小。對應到具體的操作就是使用 delete 命令.
而且,我們還可以發(fā)現(xiàn),對于第一種刪除記錄的情況,由于復用時會有范圍的限制,所以就會出現(xiàn)很多空隙的情況,比如刪除 R4,插入的卻是 ID=800.
插入操作也會造成空隙
在插入數(shù)據(jù)時,如果數(shù)據(jù)按照索引遞增順序插入,索引的結構會是緊湊的。但如果是隨機插入的,很可能造成索引數(shù)據(jù)頁分裂。
比如給已滿的 Page A 插入數(shù)據(jù)。
由于 Page A 滿了,所以要申請 Page B,調(diào)整 Page A 的過程到 Page B,這也稱為頁分裂。
結束后 Page A 就有了空隙。
另外對于更新操作也是,先刪除再插入,也會造成空隙。
進而對于大量進行增刪改的表,都有可能存在空洞。如果把空洞去掉,自然空間就被釋放了。
使用重建表
為了把表中的空隙去掉,這時就可以采用重新建一個與表 A 結構相同的表 B,然后按照主鍵 ID 遞增的順序,把數(shù)據(jù)依次插入到 B 表中。
由于是順序插入,自然 B 表的空隙不存在,數(shù)據(jù)頁的利用率也更高。之后用表 B 代替表 A,好像起到了收縮表 A 空間的作用。
具體通過:
alter table A engine=InnoDB
在 5.5 版本后,該命令和上面提到的流程差不多,而且 MySQL 會自己完成數(shù)據(jù),交換表名,刪除舊表的操作。
但這就有一個問題,在 DDL 中,表 A 不能有更新,此時有數(shù)據(jù)寫入表 A 的話,就會造成數(shù)據(jù)丟失。
在 5.6 版本后引入了 Online DDL。
Online DDL
Online DDL 在其基礎上做了如下的更新:
重建表的過程如下:
由于 row log 日志文件存在,可以在重建表示,對表 A 進行 DML 操作。
需要注意的是,在 alter 語句執(zhí)行前,會先申請 MDL 寫鎖,但在拷貝數(shù)據(jù)前會退化成 MDL 讀鎖,從而支持 DML 操作。
至于為什么不大 MDL 去掉,是防止其他線程對這個表同時做 DDL 操作。
對于大表來說,該操作很耗 IO 和 CPU 資源,所以在線上操作時,要控制操作時間。如果為了保證安全,推薦使用 gh-ost 來遷移。
Online 和 inplace
首先說一下 inplace 和 copy 的區(qū)別:
在 Online DDL 中,表 A 重建后的數(shù)據(jù)放在 tmp_file 中,這個臨時文件是在 InnoDB 內(nèi)部創(chuàng)建出來的。整個 DDL 在 InnoDB 內(nèi)部完成。進而對于 Server 層來說,并沒有數(shù)據(jù)移動到臨時表中,是一個 "原地" 操作,所以叫 "inplace" .
而在之前普通的 DDL 中,創(chuàng)建后的表 A 是在 tmp_table 是 Server 創(chuàng)建的,所以叫 "copy"
對應到語句其實就是:
-- alter table t engine=InnoDB 默認為下面 alter table t engine=innodb,ALGORITHM=inplace; -- 走的就是 server 拷貝的過程 alter table t engine=innodb,ALGORITHM=copy;
需要注意的是 inplace 和 Online 并不是對應關系:
拓展
說一下 optimize,analyze,alter table 三種重建表之間的區(qū)別:
在事務里面使用 alter table 默認會自動提交事務,保持事務一致性
如果有時,在重建某張表后,空間不僅沒有變小,甚至還變大了一點點。這時因為,重建的這張表本身沒有空隙,在 DDL 期間,剛好有一些 DML 執(zhí)行,引入了一些新的空隙。
而且 InnoDB 不會把整張表填滿,每個頁留下 1/16 給后續(xù)的更新用,所以可能遠離是緊湊的,但重建后變成的稍有空隙。
總結
現(xiàn)在我們知道,在使用 delete 刪除數(shù)據(jù)時,其實對應的數(shù)據(jù)行并不是真正的刪除,InnoDB 僅僅是將其標記成可復用的狀態(tài),所以表空間不會變小。
通常來說,在標記復用空間時分為兩種,一種是僅將某些數(shù)據(jù)頁中的位置標記為刪除狀態(tài),但這樣的位置只會在一定范圍內(nèi)使用,會出現(xiàn)空隙的情況。
另一種是將整個數(shù)據(jù)頁標記成可復用的狀態(tài),這樣的數(shù)據(jù)頁沒有限制,可直接復用。
為了解決這個問題,我們可以采用重建表的方式,其中在 5.6 版本后,創(chuàng)建表已經(jīng)支持 Online 的操作,但最后是在業(yè)務低峰時使用
看完上述內(nèi)容,你們對MySQL刪除數(shù)據(jù)表文件大小不變的原因是什么有進一步的了解嗎?如果還想了解更多知識或者相關內(nèi)容,請關注億速云行業(yè)資訊頻道,感謝大家的支持。
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。