InnoDB中怎么插入數(shù)據(jù)

發(fā)布時間：2021-07-24 16:08:34 來源：億速云閱讀：133 作者：Leah 欄目：數(shù)據(jù)庫

本篇文章給大家分享的是有關(guān)InnoDB中怎么插入數(shù)據(jù)，小編覺得挺實(shí)用的，因此分享給大家學(xué)習(xí)，希望大家閱讀完這篇文章后可以有所收獲，話不多說，跟著小編一起來看看吧。

表空間/Tablespace

假如，我想成為一名文學(xué)家，立志寫一部長篇巨著，那么就需要把文字記錄在紙張上。第一步就是從造紙廠購買兩大卷未做裁切的白紙。相應(yīng)的，在計(jì)算機(jī)中，所有數(shù)據(jù)也需要記錄在磁盤、磁帶、光盤等存儲介質(zhì)上進(jìn)行長期保存。

這些介質(zhì)被劃分成文件，它們是存儲數(shù)據(jù)的物理空間。

由于我買了兩卷紙，而任何一卷都可以存儲文字，因此每當(dāng)我開始下筆時，都費(fèi)勁心思難以抉擇：到底應(yīng)該記錄到哪一卷中?這對于有選擇困難癥的我來說苦不堪言。

于是，我計(jì)劃請一個秘書，把要寫的內(nèi)容口述給他，通過他幫我文字謄寫到具體的紙卷上，至于到底寫在哪一卷上，我無所謂。

同理，用程序操作文件時，首先也需要指定文件路徑。可是在數(shù)據(jù)庫中，表是面向開發(fā)，而存儲設(shè)備是面向運(yùn)維。開發(fā)創(chuàng)建表時，很難確定一張表對應(yīng)哪個文件。而運(yùn)維也會根據(jù)實(shí)際情況動態(tài)為數(shù)據(jù)庫添加文件。

表與文件的緊耦合嚴(yán)重制約了數(shù)據(jù)庫使用的便利性，于是在文件與表之間增加一層表空間便順理成章，它向上對接表，向下對接文件;開發(fā)者只需在表空間中操作表，而具體存儲由Innodb存儲引擎根據(jù)表空間自動維護(hù)。

InnoDB中怎么插入數(shù)據(jù)

表空間是InnoDB存儲引擎中邏輯結(jié)構(gòu)的最高層，所有數(shù)據(jù)邏輯上都存儲在表空間中。

表空間主要包括以下幾種類型：

系統(tǒng)表空間存儲change buffer, doublewrite buffer以及與innodb相關(guān)的所有對象的元數(shù)據(jù)。如：表空間和數(shù)據(jù)庫信息，表結(jié)構(gòu)與字段信息等等。mysql8.0中移除了原先用于存儲表結(jié)構(gòu)信息的.frm文件，所有元數(shù)據(jù)都存儲在此系統(tǒng)表空間中。系統(tǒng)表空間information_schema庫中相關(guān)的核心視圖如下：

InnoDB中怎么插入數(shù)據(jù)

假如數(shù)據(jù)庫world中有一張對應(yīng)表user表，測試如下：查詢表所屬表空間信息：select * from information_schema.innodb_tablespace where name='world/user'; (space:表空間id，name：表空間名)

InnoDB中怎么插入數(shù)據(jù)

查詢表空間對應(yīng)的數(shù)據(jù)文件信息：select * from information_schema.files where tablespace_name='world/user'; (file_name：數(shù)據(jù)文件相對路徑)

InnoDB中怎么插入數(shù)據(jù)

查詢表對應(yīng)的id: select * from information_schema.innodb_tables where name='world/user';

InnoDB中怎么插入數(shù)據(jù)

查詢主鍵索引對應(yīng)的根節(jié)點(diǎn)所在的頁號(root page no) select * from information_schema.innodb_indexes where table_id=1269 and name='primary'; (page_no：B+樹 root page no;name='primary'表示主鍵索引)

InnoDB中怎么插入數(shù)據(jù)

系統(tǒng)表空間也有對應(yīng)的數(shù)據(jù)文件，這個文件默認(rèn)為(windows下)xxx\MySQL Server 8.0\Data\ibdata1。只有系統(tǒng)表空間可以指定多個文件，其它類型的表空間都只能指定一個數(shù)據(jù)文件。

獨(dú)立表空間每張表對應(yīng)一個獨(dú)立的表空間。通過配置my.ini中的參數(shù)：innodb_file_per_table=1啟動獨(dú)立表空間，否則，默認(rèn)為系統(tǒng)表空間。5.6.6之后此配置默認(rèn)開啟，因此默認(rèn)為獨(dú)立表空間。

InnoDB中怎么插入數(shù)據(jù)

當(dāng)創(chuàng)建表時，會自動為表創(chuàng)建一個對應(yīng)表名的表空間，并在數(shù)據(jù)庫目錄下生成一個“表名.ibd”的表空間文件。如：在數(shù)據(jù)庫world中創(chuàng)建user表結(jié)果如下

InnoDB中怎么插入數(shù)據(jù)

普通表空間即通過“create tablespace 表空間名” 手動創(chuàng)建的表空間。
臨時表空間存儲臨時表以及臨時表變化對應(yīng)的回滾段。默認(rèn)的臨時文件為(windows下)xxx\MySQL Server 8.0\Data\ibtmp1

區(qū)/簇/Extent

由于一卷原始的紙?zhí)^于龐大，展開后可能會鋪滿我豪宅地板十幾層，甚至幾十層，非常不方便使用，畢竟我9平米的豪宅還需要留出空間會客。最好的辦法就是把這些紙張切割成一張張A4大小的數(shù)據(jù)頁。

同理，一個磁盤或文件的容量也是非常可觀，極其不便管理，因此innodb把文件劃分成一個個大小相等的存儲塊，這些塊也被稱為頁;

InnoDB中怎么插入數(shù)據(jù)

對于一部文學(xué)故事而言，只要通過頁碼就可以依次找到下一頁，從而完整的讀完這個故事。通常我們讀完第一頁時，會馬上接著讀第二頁，但此時對應(yīng)的書頁如果零散的分布在臥室、廁所、客廳，將使閱讀體驗(yàn)大大折扣。如果能把這些分散的書頁合訂成本，就可以極大地提高閱讀的便利性。

根據(jù)局部性原理，cpu在使用的數(shù)據(jù)時，下一步也會大概率使用邏輯上相鄰的數(shù)據(jù)。因此為了提高數(shù)據(jù)讀操作的性能，innodb把邏輯上相臨的數(shù)據(jù)盡可能在物理上也存儲在相鄰的頁中;為了實(shí)現(xiàn)這一目標(biāo)，Innodb引入了區(qū)/簇的概念;

InnoDB中怎么插入數(shù)據(jù)

一個區(qū)/簇是物理上連續(xù)分配的一段空間,extent又被劃分成連續(xù)的頁，以存儲同一邏輯單元的數(shù)據(jù)(如下面的索引段、數(shù)據(jù)段)。一個區(qū)/簇，默認(rèn)由64個連續(xù)的頁(Page)組成，每個頁默認(rèn)大小為16K。

實(shí)際上，innodb是先把文件劃分成連續(xù)的區(qū)/簇，然后在區(qū)/簇內(nèi)再劃分出連續(xù)的頁，從總體上看：一個文件即是微觀上一系列連續(xù)的頁組成，也是宏觀上一系列連續(xù)的區(qū)/簇組成。知道一個頁的頁號和頁大小就可以計(jì)算出此頁在磁盤上的具體位置，同理知道一個頁號就可以計(jì)算出一個區(qū)/簇的大小以及頁所在的區(qū)/簇是第幾個區(qū)/簇(它本身沒有編號，但假設(shè)第一個區(qū)/簇為0號，可以知道它邏輯上是第幾個)。

如果把頁看作現(xiàn)實(shí)書本中的頁，那么extent可以看作現(xiàn)實(shí)中的書本。

區(qū)的目的是為邏輯單元分配連續(xù)的空間，同時也用于管理區(qū)內(nèi)的存儲空間狀態(tài)(如：區(qū)內(nèi)哪些頁已滿，哪些還未使用，哪些包含碎片)。具體通過不同的區(qū)/簇鏈表來指明區(qū)本身的空間狀態(tài)，以及通過XDES Entry中的XDES_BITMAP指明區(qū)內(nèi)頁的空間狀態(tài))。

###段/Segment

當(dāng)年大劉寫完三體第一本后，遲遲沒有更新，但由于內(nèi)容過于精彩，導(dǎo)致奧巴馬又是寫郵件，又是通過外交手段催更。為了避免中美關(guān)系受損，大劉如法炮制，又連續(xù)寫了兩本。

在邏輯上故事情連貫的這三本書總體上都叫三體，于是我們稱這種具有相關(guān)性的多本書為一套。同理，innodb把邏輯上有關(guān)聯(lián)的區(qū)/簇歸屬為一個段。

InnoDB中怎么插入數(shù)據(jù)

為了使同一邏輯單元可以在物理上具有連續(xù)的存儲空間，Innodb提出的區(qū)的概念，但是io的最小操作單元為頁，一次io并不能寫滿一個區(qū)，同時數(shù)據(jù)是可以擦除(刪除)重寫，因此必須記錄區(qū)自身以及區(qū)內(nèi)的空間狀態(tài)：哪些區(qū)已寫滿，哪些區(qū)還未使用，哪些區(qū)還有碎片空間。

innodb中把這些記錄具有相關(guān)性區(qū)的存儲空間狀態(tài)的管理信息稱為段實(shí)體，段實(shí)體所管理的區(qū)的總和稱為段。段的目的是管理區(qū)的使用情況以及為數(shù)據(jù)分配空間時，提供空間存儲狀態(tài)。

段可以類似的看做現(xiàn)實(shí)中一套書中的套。

innodb中數(shù)據(jù)是以B+樹的方式組織，葉子節(jié)點(diǎn)存儲關(guān)鍵字與行數(shù)據(jù)，非葉子節(jié)點(diǎn)存儲關(guān)鍵字(索引數(shù)據(jù))與頁號。索引數(shù)據(jù)與業(yè)務(wù)行數(shù)據(jù)分別具有不同的數(shù)據(jù)結(jié)構(gòu)，因此它們被分開存儲，非葉子節(jié)點(diǎn)的索引數(shù)據(jù)存儲在一個段中，葉子節(jié)點(diǎn)的業(yè)務(wù)數(shù)據(jù)存儲在另一個段，對應(yīng)的它們也分別存儲在不同結(jié)構(gòu)的區(qū)和頁中。

數(shù)據(jù)邏輯結(jié)構(gòu)如下：

InnoDB中怎么插入數(shù)據(jù)

物理存儲結(jié)構(gòu)如下：

InnoDB中怎么插入數(shù)據(jù)

段是表空間的邏輯組成部分，用來存儲具有相同意義的數(shù)據(jù)，如：B+對中的非葉子節(jié)點(diǎn)或B+樹中的葉子節(jié)點(diǎn)。常見的段有數(shù)據(jù)段、索引段、回滾段等。

每創(chuàng)建一個索引就會創(chuàng)建兩個段:一個是數(shù)據(jù)段(B+樹對應(yīng)的葉子節(jié)點(diǎn))，一個是索引段(非葉子節(jié)點(diǎn))。對于聚集索引(一般是主鍵索引)數(shù)據(jù)段存儲的是索引關(guān)鍵字和業(yè)務(wù)行(所有字段);對于非聚集索引，數(shù)據(jù)段存儲的是索引關(guān)鍵字和主鍵;如果通過非聚集索引查詢，需要先通過B+樹查出主鍵，再通過主鍵從聚集索引中二次查詢具體的行,這稱為回表。下圖：左邊為二級索引(非聚集索引)，右邊為主鍵索引(聚集索引)

InnoDB中怎么插入數(shù)據(jù)

表數(shù)據(jù)是通過聚集索引組織存儲，也即按主鍵索引創(chuàng)建的B+樹存儲數(shù)據(jù)，因此創(chuàng)建表時應(yīng)該同時指定一個主鍵。如果沒有指定主鍵，也沒有創(chuàng)建唯一索引，表會默認(rèn)創(chuàng)建一個自增的隱藏字段:row_id做為聚集索引B+樹的關(guān)鍵字段。因?yàn)槭请[藏字段，所以這個字段只能回表查詢時使用。

頁/Page

正如上面所說，頁就像現(xiàn)實(shí)中一本書的書頁一樣，是innodb中io操作的最小單位。innodb中的頁類似于現(xiàn)實(shí)中書本的頁。

頁的大小默認(rèn)是16KB;可以通過innodb_page_size參數(shù)指定，可選項(xiàng)為：4KB、8KB、16KB、32KB、64KB;當(dāng)page size為4、8、16KB時，對應(yīng)一個extent的page數(shù)量同步變化，以保證extent(區(qū)/簇)大小保持1M不變。當(dāng)page size為32KB或64KB時，extent內(nèi)的page數(shù)量保證不變，extent同步變?yōu)?M和4M;

每個頁都有一個對應(yīng)的從0開始的編號，這個編號叫做頁號。因?yàn)楸砜臻g的數(shù)據(jù)文件會被劃分成大小相等的頁，所以知道頁號，再根據(jù)文件的初始位置，就可以計(jì)算出頁在磁盤中的準(zhǔn)確地址。

同理，一張表對應(yīng)一個聚集索引，而聚集索引元數(shù)據(jù)中指定了root page的頁號，因此Innodb引擎可以根據(jù)頁號和頁大小計(jì)算出索引B+樹root page的準(zhǔn)確地址，從而對整個表數(shù)據(jù)進(jìn)行操作。

page主要用來存儲業(yè)務(wù)相關(guān)的數(shù)據(jù)，但是為了管理內(nèi)存分配而存在的extent和segment信息也需要page存儲。innodb根據(jù)page存儲內(nèi)容不同分以下幾類：

FSP HDR 頁：一個表空間可能對應(yīng)多個數(shù)據(jù)文件，每個文件都有自己的編號。表空間是數(shù)據(jù)庫中最頂層的結(jié)構(gòu)，通過系統(tǒng)表空間中的元數(shù)據(jù)可以查詢對應(yīng)的表空間文件等元信息，卻無法查詢當(dāng)前表空間對應(yīng)的段、區(qū)等信息，因此也無法獲取表空間中頁的存儲狀態(tài)。

為了使表空間的物理存儲有一個對外訪問的入口，規(guī)定表空間中的0號文件的0號page頁中存儲表空間信息以及當(dāng)前表空間所擁有的段鏈表的指針。

任何一個頁都由頁頭、頁身和頁尾組成。

一個page默認(rèn)16KB，而段和區(qū)對應(yīng)的指針數(shù)據(jù)量并不大，因此只需要部分頭信息就可以維護(hù)。而剩下的大部分空間，則用來存儲當(dāng)前表空間擁有的部分發(fā)區(qū)實(shí)體信息。

InnoDB中怎么插入數(shù)據(jù)

頁頭：指明當(dāng)前頁號、類型和所屬表空間。頁尾：主要用于數(shù)據(jù)的校驗(yàn)。頁身：這是頁中用來存儲數(shù)據(jù)的主要部分。

頁身又分為表空間首頁頭信息區(qū)和業(yè)務(wù)數(shù)據(jù)區(qū)。FSP HEADER：(1)：表空間信息：對應(yīng)空間id、表空間總頁數(shù)等 (2)：段信息：已寫滿數(shù)據(jù)的段實(shí)體所在頁的鏈表指針、未寫滿數(shù)據(jù)的段實(shí)體所在頁的鏈表指針(指向的不是段實(shí)體而是段實(shí)體所在的頁，一頁存儲85個段實(shí)體)。(3)：碎片區(qū)/簇信息：空閑的碎片區(qū)/簇(XDES實(shí)體本身，不是XEDS實(shí)體所在的頁)鏈表指針、未寫滿的碎片區(qū)鏈表指針、已寫滿的碎片區(qū)鏈表。這些區(qū)/簇信息不屬于任何段，而屬于表空間，用于給段下次申請空間時分配。

理論上一個區(qū)/簇會完整的分配給一個段，但一些區(qū)/簇創(chuàng)建后直接歸屬表空間，用做碎片區(qū)。為了減少浪費(fèi)，只會把這些區(qū)中的部分頁分配給一個指定的段。

例如：當(dāng)你豪言萬丈的宣布要寫一部曠世巨著，并要求秘書給你五百頁紙時，秘書很可能已經(jīng)看透了一切，一面是是是的回應(yīng)你，一面只會給你取3頁紙，因?yàn)樗J(rèn)為你很可能7天憋不出6個字。同理，innodb給某一個新創(chuàng)建的段分配空間時，并不是一開始就分配一個區(qū)/簇，而是從碎片區(qū)中先分配32頁，只有這32頁使用完，innodb才認(rèn)為這個段是一個大數(shù)據(jù)段，從而正式開始為其分配一個完整的區(qū)/簇。

數(shù)據(jù)部分：

FSP HEADER中指向了段鏈表和碎片區(qū)鏈表，但這些只是鏈表指針，真正的區(qū)信息節(jié)點(diǎn)則存放在當(dāng)前頁的數(shù)據(jù)區(qū)。一個區(qū)/簇信息實(shí)體稱為一個XDES Entry(eXtent DEScript);一頁存儲256個XDES Entry。

XDES Entry如上面圖示，包含了段id(如果分配給一個段)、碎片區(qū)鏈表中的下一個節(jié)點(diǎn)指針等。它不包含頁信息，因?yàn)閰^(qū)/簇有對應(yīng)的物理空間，它空間內(nèi)的頁就是擁有的頁，因此無需在entry中指明。

細(xì)心的朋友會發(fā)現(xiàn)，XDES Entry雖然是描述區(qū)/簇，但卻沒有指定區(qū)/簇的編號或地址，那么它到底對應(yīng)物理空間中哪塊區(qū)/簇呢?

區(qū)/簇本身沒有編號，但區(qū)/簇像頁一樣，也是從文件第一個字節(jié)開始連續(xù)分配的。同時，每隔256個區(qū)/簇的第一個區(qū)的第一頁就是這256個區(qū)/簇的索引頁，即XDES page。

而XDES page有page No，因此就可以計(jì)算出此XDES page的地址，也即此page所有的區(qū)/簇的地址。緊接著的255個區(qū)/簇都有一個對應(yīng)的XDES Entry存儲在XDES page中，這些XDES Entry在此page中位置的偏移量，即為后面255個區(qū)/簇的偏移量，從當(dāng)前XDES page所有區(qū)/簇位置以及對應(yīng)的偏移量就可以計(jì)算出一個XDES Entry對應(yīng)的區(qū)/簇的物理位置。

FSP HDR頁就像一個表空間的封面頁，是整個表空間的入口頁。

XDES 頁：XDES 頁即eXtent DEScript 區(qū)/簇描述頁的縮寫，用來存儲區(qū)/簇信息實(shí)體的頁，即存儲XDES Entry的頁。它除了與FSP頁中FSP HEADER不同外，其它內(nèi)容一模一樣。本質(zhì)上首頁也是一個XDES頁，只是首頁是整個表空間的第一頁，因此它又兼職記錄了表空間信息。

XDES Entry：存儲了區(qū)自身信息的邏輯塊。

因?yàn)橐豁揦DES只能存儲256個entry，對應(yīng)256個區(qū)，因此邏輯上每隔256個區(qū)，就需要一個xdex頁來存儲下一系列256個區(qū)的信息。

INODE 頁：同區(qū)/簇對應(yīng)的Entry信息一樣，表空間只是指向了各種狀態(tài)的段頁(非段實(shí)體)鏈表，而未存儲段信息本身。inode頁就是用來存儲描述段信息 inode entry的頁。

InnoDB中怎么插入數(shù)據(jù)

一個inode頁默認(rèn)存儲85條段實(shí)體，每個實(shí)體又指向了本段對應(yīng)的不同狀態(tài)的區(qū)/簇鏈表：未使用的區(qū)/簇鏈表、已寫滿的區(qū)/簇鏈表、未寫滿的區(qū)/簇鏈表。

Index 頁以上的頁均是存儲物理空間使用狀態(tài)，并用于管理區(qū)/簇和段本身的頁。index頁則是用于最終存儲業(yè)務(wù)數(shù)據(jù)。innodb中表數(shù)據(jù)是通過聚集索引組織存儲的，而葉子節(jié)點(diǎn)存儲在一個段中，非葉子節(jié)點(diǎn)存儲在另一個段中，但最終都會存儲在Index類型的頁中。

index頁詳細(xì)項(xiàng)如下圖：

InnoDB中怎么插入數(shù)據(jù)

index頁頁內(nèi)存儲結(jié)構(gòu)如下圖：

InnoDB中怎么插入數(shù)據(jù)

頁內(nèi)的業(yè)務(wù)數(shù)據(jù)是一個邏輯上按順序排列的單向鏈表。頁內(nèi)有兩條虛擬行，會別代表整個頁中索引值最小的行和最大的行，即鏈表中第一行和最后一行，用來界定鏈表的范圍。

另外，對于索引段，一頁大概有16250B用來存儲用戶數(shù)據(jù)。一行包含一個4字節(jié)的int類型key，一個指向葉子節(jié)點(diǎn)占6字節(jié)的頁號，大概6字節(jié)的row header，總共大概16字節(jié)。那么一頁粗略的計(jì)算可以存儲16250/16約為1000條。為了優(yōu)化查詢，每隔4-8行數(shù)據(jù)把這幾行數(shù)據(jù)的第一行地址在存放在一個稱為slot的2字節(jié)空間中，這些slot一起組成一個稱為Page directory的數(shù)組中。

如圖：數(shù)組最后一個slot存儲第一行infimum，倒數(shù)據(jù)第二個slot存儲row4，正序第一個slot存儲最后一行數(shù)據(jù)supremum。這樣page directory數(shù)組就是一個有序的數(shù)組，可以通過一次二分查找算法快速定位數(shù)據(jù)塊，然后在這個塊中遍歷找到最終符合要求的數(shù)據(jù)。

注意：由于用戶行與頁尾之間有空閑空間，而slot個數(shù)受頁內(nèi)行數(shù)影響而不固定，即page dirctory數(shù)組長度不固定，因此通過逆序向前追加的方式分配slot。

整體結(jié)構(gòu)

以上是表空間中不同對象各自的結(jié)構(gòu)和數(shù)據(jù)信息，下面從整體的角度看一看各個組件是如何關(guān)聯(lián)的。

InnoDB中怎么插入數(shù)據(jù)

微觀上，表空間文件從物理上分隔為大小相等且連續(xù)的頁。
宏觀上，表空間文件從物理上分隔為大水相乘且連續(xù)的區(qū)/簇。
0號文件的0號頁稱為FSP頁，即首頁，可以假定為表空間的封面頁。它存儲了整個表空間其它組件的鏈表指針，是整個表空間的入口頁。
從邏輯上，F(xiàn)SP頁通過兩條線指向不同組件。(1)：通過FSP_SEG_INODES_FULL(已寫滿的段頁鏈表)和FSP_SEG_INODES_FREE(未寫滿的段頁鏈表)，指向段信息。段實(shí)體又通過FSEG_FREE(空閑的區(qū)/簇鏈表)、FSEG_FULL(寫滿的區(qū)/簇)、FSEG_NOT_FULL(未寫滿的區(qū)/簇)，指向?qū)儆诒径蔚膮^(qū)/簇。(2)：通過FSP_FREE(空閑的區(qū)/簇鏈表)、FSP_FREE_FRAG(未寫滿的碎片區(qū)/簇)、FSP_FULL_FRAG(已寫滿的碎片區(qū)/簇)，指向不屬于任何段的區(qū)/簇。
每256個區(qū)/簇的第一個區(qū)/簇的第一頁存儲這256個區(qū)/簇的管理信息。0號頁因?yàn)樘厥饨凶鯢SP頁，其它叫做XDES頁。通過這個頁號以及存儲在其中的Entry位置偏移量，可以很容易的計(jì)算出這256個區(qū)在磁盤上的位置。因此即使XDES Entry中沒有記錄區(qū)/簇的編號或地址，也可以知道每個Entry管理的是哪個區(qū)/簇。
當(dāng)index頁中插入一條數(shù)據(jù)時，如果本頁已滿，則需要向此頁所在的區(qū)/簇申請空間，如果此區(qū)/簇也滿了，則向所在的段申請，如果段也滿了，則會向表空間申請，表空間會通過操作系統(tǒng)向磁盤申請3個區(qū)/簇，并加入到FSP中的FSP_FREE鏈表中。然后再一級級分配，存儲到其對應(yīng)的鏈表中。

行/Row

以上介紹的所有對象都是為了給業(yè)務(wù)數(shù)據(jù)分配一塊用來存儲的物理空間，到此終于可以在指定的頁中記錄業(yè)務(wù)數(shù)據(jù)。而innodb是基于行進(jìn)行存儲，下面簡單的看一看行Compact格式的存儲結(jié)構(gòu)。

InnoDB中怎么插入數(shù)據(jù)

每條記錄都包含一系列頭信息，描述當(dāng)前記錄的存儲狀態(tài)如圖。但是除了頭信息外，則根據(jù)記錄所在節(jié)點(diǎn)不同存儲的數(shù)據(jù)也有所不同。

聚集索葉子節(jié)點(diǎn)，記錄存儲的是表中的業(yè)務(wù)行，除行數(shù)據(jù)本身外，還包含了事務(wù)id，回滾段指針，以及在沒有指定主鍵和唯一索引時還包含一個隱藏的row_id。
非葉子節(jié)點(diǎn)針對的是B+樹搜索，因此記錄的是子節(jié)點(diǎn)的最小記錄值以及子節(jié)點(diǎn)的頁號。

B+樹節(jié)點(diǎn)與page的關(guān)系

Innodb page只是物理上的存儲空間，相當(dāng)于一本書的一頁，僅僅是數(shù)據(jù)的載體。B+樹節(jié)點(diǎn)是數(shù)據(jù)的邏輯結(jié)構(gòu)，理論上它們沒有必然的關(guān)系?？梢栽谝粋€page頁內(nèi)存儲一棵完整的B+樹，也可以多個page頁一起存儲一棵完整的B+樹，甚至可以把page頁與B+樹中的節(jié)點(diǎn)一一對應(yīng)。

實(shí)際上Innodb中為了實(shí)現(xiàn)簡單，B+樹節(jié)點(diǎn)與page頁是一一對應(yīng)，以下是其簡單的擴(kuò)展過程。

假設(shè)有一個聚集索引B+樹開始的樣子如下：

InnoDB中怎么插入數(shù)據(jù)

向B+樹中插入16、17、18三行數(shù)據(jù)如下(綠色部分):

InnoDB中怎么插入數(shù)據(jù)

向B+樹繼續(xù)插入19一行數(shù)據(jù)，原先的空間已滿擴(kuò)展如下(藍(lán)色部分)：

InnoDB中怎么插入數(shù)據(jù)

如果聚集索引使用的是自增的主鍵，那么數(shù)據(jù)是以追加的方式存儲在每一頁中，如果頁已經(jīng)存滿，只需要重新分配一頁空間繼續(xù)追加即可。

如果聚集索引使用的是無順序的列如uuid，由于B+是一個邏輯上有序的集合，那么向B+樹中插入數(shù)據(jù)就很可能插入到原先已經(jīng)滿了的page頁中，就會導(dǎo)致原來的頁進(jìn)行分裂。會像向數(shù)組中插入數(shù)據(jù)一樣先進(jìn)行移動，為新數(shù)據(jù)騰出空間。因此建議使用有序的列做聚集索引。

InnoDB中怎么插入數(shù)據(jù)

如何一步步存儲一條數(shù)據(jù)

經(jīng)歷了千辛萬苦，終于可以從頭到尾插入一條數(shù)據(jù)，一探innodb如何一步步把數(shù)據(jù)存儲到文件中。妹妹們估計(jì)已經(jīng)聽的如癡如醉，想想都開心，我可真是個小機(jī)靈鬼。

伸伸懶腰，甜甜的望向妹妹們。

哎，人呢?我是穿越到平等空間了嗎?

算了，善始善終，我就講給自己聽，迷倒不了別人，我還不信迷倒不了自己。

在數(shù)據(jù)庫world中創(chuàng)建表user

CREATE TABLE user (    id int(11) NOT NULL AUTO_INCREMENT,    name varchar(10) DEFAULT NULL,    age int(11) DEFAULT NULL,    gender smallint(6) DEFAULT NULL,    create_time date DEFAULT NULL,    PRIMARY KEY (id)  ENGINE=InnoDB DEFAULT CHARSET=utf8mb4

innodb向系統(tǒng)表空間的information_schema庫的tables和columns中存入表結(jié)構(gòu)信息

InnoDB中怎么插入數(shù)據(jù)

創(chuàng)建表空間同時創(chuàng)建獨(dú)立表空間world/user以及對應(yīng)的數(shù)據(jù)文件world/user.ibd，并更新到information_schema.innodb_tablespaces中

InnoDB中怎么插入數(shù)據(jù)

同步更新表空間所對應(yīng)的文件信息到information_schema.files中

InnoDB中怎么插入數(shù)據(jù)

規(guī)定表空間0號文件即world/user.ibd文件的0號頁為表空間的封面頁。

創(chuàng)建聚集索引如果指定的主鍵或唯一索引，則使用指定的列創(chuàng)建聚集索引，否則使用隱藏列row_id創(chuàng)建聚集索引，并存儲到information_schema.innodb_indexes中

InnoDB中怎么插入數(shù)據(jù)

為索引創(chuàng)建兩個段：索引段(非葉子節(jié)點(diǎn))和數(shù)據(jù)段(葉子節(jié)點(diǎn))，并把段信息存儲到表空間封面頁的段鏈表中。

為索引創(chuàng)建第一頁即Root Page，把段信息記錄在Root Page的段鏈表中，從而管理本B+樹的段信息。同時把Root PageNo記錄到information_schema.innodb_indexes中，如上圖。從頁使邏輯表與物理存儲關(guān)聯(lián)起來，這個Root Page相當(dāng)于索引的封面。

插入數(shù)據(jù) 向表中插入一條數(shù)據(jù)如下

insert into world.user(name,age,gender,create_time)  values('木葉瀟瀟',18,1,now())

從sql中提取數(shù)據(jù)庫名和表名，從information_schema.innodb_tables中查出表id

InnoDB中怎么插入數(shù)據(jù)

根據(jù)表id，從information_schema.innodb_indexes中查出表對應(yīng)的聚集索引的Root Page No 為4。

InnoDB中怎么插入數(shù)據(jù)

通過Root Page No 4計(jì)算出Root Page的物理地址。根據(jù)Root Page中指定的段信息，向Root Page中插入索引數(shù)據(jù)，向數(shù)據(jù)段對應(yīng)的頁中插入數(shù)據(jù)行，并關(guān)聯(lián)兩種類型的頁。

如果一頁空間不足，會計(jì)算出當(dāng)前頁所在的區(qū)/簇并向其申請空間，區(qū)/簇則會根據(jù) XDES Entry中的bitmap查詢空閑的頁并進(jìn)行分配。如果區(qū)/簇也沒有空閑空間，則會一級一級向上面的段、表空間、操作系統(tǒng)申請所需空間。

申請到的表空間會存儲在各自對應(yīng)的鏈表中(如：表空間申請到的空間會存儲在對應(yīng)的FSP_FREE鏈表中)。

在頁分配或擴(kuò)展時，為了保證通過innodb_indexes中的Root Page No能找到它，Root Page物理空間與B+樹對應(yīng)的Root 節(jié)點(diǎn)保持不變,即頁號不變，永遠(yuǎn)是頁號為4的那塊空間。

當(dāng)B+對應(yīng)的物理頁不斷變化時，為了保證樹的平衡，會產(chǎn)生新的Root節(jié)點(diǎn)，為了保持Root頁不變，innodb是通過交換的方式，把新的Root節(jié)點(diǎn)數(shù)據(jù)復(fù)制交換到原來的Root Page頁，這樣就可以保證Root Page永遠(yuǎn)不變，即保證表與物理空間的關(guān)聯(lián)永遠(yuǎn)不會斷開。

總結(jié)

表空間是數(shù)據(jù)庫中的邏輯結(jié)構(gòu)，它解耦了表、索引等與文件的關(guān)聯(lián)。
段也是一個邏輯結(jié)構(gòu)，它讓具有具體相同邏輯含義和相同存儲結(jié)構(gòu)的數(shù)據(jù)歸為一組，方便管理。
區(qū)是物理存儲結(jié)構(gòu)，對應(yīng)大磁盤中真實(shí)的物理空間。它從文件第一個字節(jié)開始按相同大小劃分，并通過XDES Entry在邏輯上把區(qū)串聯(lián)起來。通過XDES Entry所在頁以及頁內(nèi)偏量可以計(jì)算出XDES Entry與它管理的物理空間區(qū)的關(guān)系。
頁是物理存儲IO操作的最小單元。它也是從文件第一個字節(jié)開始按相同大小劃分。表是通過索引的方式組織數(shù)據(jù)，聚集索引元數(shù)據(jù)中存儲了此表對就的Root page No。頁是有編號的，通過編號就可與物理空間建立關(guān)聯(lián)。

段、區(qū)都是為了管理空間的存儲狀態(tài)，為頁分配空間服務(wù)，真正的查詢只需要通過Page No和B+樹中各級節(jié)點(diǎn)的關(guān)聯(lián)關(guān)系就可以操作整個表物理空間上的數(shù)據(jù)。

行是最終存儲業(yè)務(wù)數(shù)據(jù)的物理單元。默認(rèn)一頁16K，可以存儲大概1000多行索引數(shù)據(jù)(非葉子節(jié)點(diǎn))，或者20行甚至更多的業(yè)務(wù)數(shù)據(jù)(葉子節(jié)點(diǎn))。頁之間通過B+樹的“二分找查(假設(shè)為多分)”算法快速定位數(shù)據(jù)，頁內(nèi)則通過 Page Directory，把多行分一組，一組對應(yīng)Page Directory有序數(shù)組中的一個slot，這樣可以在頁內(nèi)進(jìn)行一次“二分查找”優(yōu)化。

為了記錄行本身的狀態(tài)，一條記錄innodb會增加額外的記錄頭信息。如果是葉子節(jié)點(diǎn)，還會增加：row_id(隱藏的主鍵)、trx_id(事務(wù)id)、回滾指針等附加字段。

以上就是InnoDB中怎么插入數(shù)據(jù)，小編相信有部分知識點(diǎn)可能是我們?nèi)粘９ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

InnoDB中怎么插入數(shù)據(jù)

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽