溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

MySQL聚簇索引的優(yōu)缺點(diǎn)是什么

發(fā)布時間:2023-04-19 14:16:37 來源:億速云 閱讀:104 作者:iii 欄目:MySQL數(shù)據(jù)庫

這篇文章主要介紹“MySQL聚簇索引的優(yōu)缺點(diǎn)是什么”的相關(guān)知識,小編通過實(shí)際案例向大家展示操作過程,操作方法簡單快捷,實(shí)用性強(qiáng),希望這篇“MySQL聚簇索引的優(yōu)缺點(diǎn)是什么”文章能幫助大家解決問題。

1. 什么是聚簇索引

數(shù)據(jù)庫的索引從不同的角度可以劃分成不同的類型,聚簇索引便是其中一種。

聚簇索引英文是 Clustered Index,有時候小伙伴們可能也會看到有人將之稱為聚集索引等,與之相對的是非聚簇索引或者二級索引。

聚簇索引并不是一種單獨(dú)的索引類型,而是一種數(shù)據(jù)的存儲方式。在 MySQL 的 InnoDB 存儲引擎中,所謂的聚簇索引實(shí)際上就是在同一個 B+Tree 中保存了索引和數(shù)據(jù)行:此時,數(shù)據(jù)放在葉子結(jié)點(diǎn)中,聚簇聚簇,意思就是說數(shù)據(jù)行和對應(yīng)的鍵值緊湊的存在一起。

假設(shè)我有如下數(shù)據(jù):

id(主鍵)usernameageaddressgender
1ab99深圳
2ac98廣州
3af88北京
4bc80上海
5bg85重慶
6bw95天津
7bw99???/td>
8cc92武漢
9ck90深圳
10cx93深圳

那么它的聚簇索引大概就是這個樣子:

MySQL聚簇索引的優(yōu)缺點(diǎn)是什么

那么大家可以看到,葉子上既有主鍵值(索引)又有數(shù)據(jù)行,節(jié)點(diǎn)上則只有主鍵值(索引)。

小伙伴們想想,MySQL 表中的數(shù)據(jù)在磁盤中只可能保存一份,不可能保存兩份,所以,在一個表中,聚簇索引只可能有一個,不可能有多個。

2. 聚簇索引和主鍵

有的小伙伴搞不清楚這兩者之間的關(guān)系,甚至將兩者劃等號,這是一個巨大的誤區(qū)。

在有的數(shù)據(jù)庫中,支持開發(fā)者自由的選擇使用哪一個索引作為聚簇索引,但是 MySQL 中是不支持這個特性的。

在 MySQL 中,如果表本身就有設(shè)置主鍵,那么主鍵就是聚簇索引;如果表本身沒有設(shè)置主鍵,則會選擇表中的一個唯一且非空的索引來作為聚簇索引;如果表中連唯一非空的索引都沒有,那么就會自動選擇表中的隱式主鍵來作為聚簇索引。關(guān)于 MySQL 中表的隱式主鍵,松哥會在將來的文章中和大家介紹。

不過一般來說,還是建議大家自己來為表設(shè)置主鍵,因?yàn)殡[式主鍵是自增的,自增的都會存在一個問題:在自增值上會存在非常高的鎖競爭問題,主鍵的上界會稱為熱點(diǎn)數(shù)據(jù),因?yàn)樗械牟迦氩僮鞫家麈I自增,又不能重復(fù),所以會發(fā)生鎖競爭進(jìn)而導(dǎo)致性能降低。

根據(jù)上面的介紹,我們可以總結(jié)出 MySQL 中聚簇索引和主鍵索引的關(guān)系如下:

  • 聚簇索引不一定是主鍵索引。

  • 主鍵索引一定是聚簇索引。

3. 聚簇索引優(yōu)缺點(diǎn)

先來說優(yōu)點(diǎn):

  • 相互關(guān)聯(lián)的數(shù)據(jù)我們可以將之保存在一起。例如有一個用戶訂單表,我們可以根據(jù) 用戶 ID + 訂單 ID 來聚集所有數(shù)據(jù),用戶 ID 可能會重復(fù),訂單 ID 則不會重復(fù),這樣我們就能夠?qū)⒁粋€用戶相關(guān)的訂單數(shù)據(jù)都保存在一起,如果需要查詢一個用戶的所有訂單,就會非???,只需要少量的磁盤 IO 就可以做到。

  • 不需要回表,因此數(shù)據(jù)訪問速度更快。在聚簇索引中,索引和數(shù)據(jù)都在同一棵 B+Tree 上,因此從聚簇索引中獲取到的數(shù)據(jù)比從非聚簇索引上獲取數(shù)據(jù)更快(非聚簇索引需要回表)。

  • 對于第一點(diǎn)的案例,如果我們想根據(jù)用戶 ID 查詢到這個用戶所有的訂單 ID,那么此時都不用去到葉子結(jié)點(diǎn)了,因?yàn)橹Ч?jié)點(diǎn)上就有我們需要的數(shù)據(jù),所以直接利用覆蓋索引的特性,就可以讀取到需要的數(shù)據(jù)。

這些就是聚簇索引一些常見的優(yōu)點(diǎn),我們在日常的表設(shè)計(jì)中,其實(shí)應(yīng)該充分利用好這些優(yōu)點(diǎn)。

再來看看缺點(diǎn):

  • 小伙伴們發(fā)現(xiàn),前面我們說的聚簇索引的優(yōu)勢主要是聚簇索引減少了 IO 次數(shù),從而提高了數(shù)據(jù)庫的性能,但是有的 IO 密集型應(yīng)用,可能直接上一個足夠大的內(nèi)存,把數(shù)據(jù)都讀取到內(nèi)存中操作,此時聚簇索引就沒有啥優(yōu)勢了。

  • 隨機(jī)主鍵會導(dǎo)致頁分裂問題,主鍵順序插入的話,相對來說效率會高一些,因?yàn)樵?B+Tree 中只需要不斷往后面追加即可;但是主鍵如果是非順序插入的話,效率就會低很多,因?yàn)榭赡軙婕暗巾摲至褑栴}。以上面那張圖為例,假設(shè)每個節(jié)點(diǎn)可以保存三條數(shù)據(jù),現(xiàn)在我們要插入一個主鍵是 4.5 的記錄,那么就需要把主鍵為 5 的值往后移動,進(jìn)而導(dǎo)致主鍵為 8 的節(jié)點(diǎn)也要往后移動。頁分裂會導(dǎo)致數(shù)據(jù)插入效率降低并且占用更多的存儲空間。

  • 非聚簇索引(二級索引)查詢的時候需要回表。因?yàn)橐粋€索引就是一棵索引樹,數(shù)據(jù)都在聚簇索引上,所以如果使用非聚簇索引進(jìn)行搜索,非聚簇索引的葉子上存儲的是主鍵值,先找到主鍵值,然后拿著主鍵值再來聚簇索引上搜索,這樣一共就查詢了兩棵索引樹,這就是回表。

關(guān)于“MySQL聚簇索引的優(yōu)缺點(diǎn)是什么”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識,可以關(guān)注億速云行業(yè)資訊頻道,小編每天都會為大家更新不同的知識點(diǎn)。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI