Mysql索引底層及優(yōu)化方法是什么

發(fā)布時間：2022-02-15 10:00:07 來源：億速云閱讀：110 作者：iii 欄目：MySQL數(shù)據(jù)庫

今天小編給大家分享一下Mysql索引底層及優(yōu)化方法是什么的相關(guān)知識點，內(nèi)容詳細(xì)，邏輯清晰，相信大部分人都還太了解這方面的知識，所以分享這篇文章給大家參考一下，希望大家閱讀完這篇文章后有所收獲，下面我們一起來了解一下吧。

一.首先我們說下什么是索引，為什么要用索引

索引用于快速找出在某個列中有一特定值的行，不使用索引，MySQL必須從第一條記錄開始讀完整個表，直到找出相關(guān)的行，表越大，查詢數(shù)據(jù)所花費的時間就越多，如果表中查詢的列有一個索引，MySQL能夠快速到達(dá)一個位置去搜索數(shù)據(jù)文件，而不必查看所有數(shù)據(jù)，那么將會節(jié)省很大一部分時間。

二. 索引類型分為兩類：

1.hash索引

2.bTree

三.下面我們簡單分析一下hash索引和bTree索引。

1. 哈希表是一種以鍵 - 值（key-value）存儲數(shù)據(jù)的結(jié)構(gòu)，我們只要輸入待查找的鍵即 key，就可以找到其對應(yīng)的值即 Value。哈希的思路很簡單，把值放在數(shù)組里，用一個哈希函數(shù)把 key 換算成一個確定的位置，然后把 value 放在數(shù)組的這個位置。

不可避免地，多個 key 值經(jīng)過哈希函數(shù)的換算，會出現(xiàn)同一個值的情況。處理這種情況的一種方法是，拉出一個鏈表。

2. 說到bTree，就不得不提二叉樹，二叉樹分為很多，例：二叉查找樹，平衡二叉樹等。當(dāng)然還有重點紅黑樹。
1） 二叉查找樹的特點是： 父節(jié)點左子樹所有節(jié)點的值小于父節(jié)點的值。右子樹所有節(jié)點的值大于父節(jié)點的值。 下面以一張圖為例來體現(xiàn)二叉查找樹。

ID	name
5	張五
6	張六
7	張七
2	張二
1	張一
4	張四
3	張三

Mysql索引底層及優(yōu)化方法是什么有一個需求，查找張三，如果不使用二叉查找樹那么我們需要查找7次，使用二叉查找樹我們只需要查找4次就可以找到我們想要的值。
根據(jù)上面說的使用二叉查找樹的確可以減少查詢次數(shù)，但是大家有沒有想過，如果數(shù)據(jù)庫的數(shù)據(jù)是 1，2，3，4，5，6，7這樣依次遞增的數(shù)據(jù)呢，繼續(xù)使用二叉查找樹就會變成一個鏈表了。那這樣如果我們想要查找7那么需要查找7次，掃描表也是需要7次。這樣跟沒有建立索引沒有區(qū)別，這也是弊端之一。下圖為例說明。
Mysql索引底層及優(yōu)化方法是什么
2） 平衡二叉樹：又被稱為AVL樹，它的左右兩個子樹的高度差的絕對值不超過1，并且左右兩個子樹都是一棵平衡二叉樹，AVL樹是最早發(fā)明的自平衡二叉查找樹。在AVL樹中，任何節(jié)點的兩個子樹的高度最大差別只能為1，所以它又被稱為高度平衡樹。查詢、增加和刪除在平均和最壞情況下都是O(log n)。增加和刪除會需要通過一次或多次樹旋轉(zhuǎn)來重新平衡這個樹。
我們引入二叉樹的目的是為了提高二叉樹的搜索的效率,從而減少樹的平均搜索長度，為此,就必須在每顆二叉樹插入一個結(jié)點時調(diào)整樹的結(jié)構(gòu),讓二叉樹搜索能夠保持平衡,從而可能降低樹的高度,減少的平均樹的搜索長度。
平衡二叉樹特點如下：
1.它的左子樹和右子樹都是AVL樹
2.左子樹和右子樹的高度差不能超過1
例圖：
Mysql索引底層及優(yōu)化方法是什么 3） 紅黑樹：可以理解為紅黑樹是凌駕于平衡二叉樹之上的一棵樹，紅黑樹不會追求“完全平衡 ”，它只會求部分達(dá)到平衡要求，降低了對旋轉(zhuǎn)的要求，從而提高性能。此外，由于它的設(shè)計，所有不平衡都能夠在三次旋轉(zhuǎn)之內(nèi)解決。在紅黑樹中，它的算法時間復(fù)雜度與AVL相同，并且統(tǒng)計性能會逼AVL樹更高。所以紅黑樹相對于平衡二叉樹來說，不是嚴(yán)格意義上的平衡二叉樹，紅黑樹插入和刪除效率更高一些，查詢的效率比平衡二叉樹來說相對低一些，但是二者查詢效率差值做對比，基本可以忽略不計。紅黑樹特點如下：
1. 節(jié)點是紅色或黑色。
2. 根節(jié)點是黑色。
3. 每個紅色節(jié)點的兩個子節(jié)點都是黑色。（紅色節(jié)點的子節(jié)點必須是黑色節(jié)點）
4. 從任一節(jié)點到其每個葉子的所有路徑都包含相同數(shù)目的黑色節(jié)點。
故紅黑樹是黑色平衡的樹，左子樹與右子樹高度差不會超過2。紅節(jié)點的父節(jié)點、子節(jié)點只能是黑節(jié)點。
例圖：
Mysql索引底層及優(yōu)化方法是什么
4） BTree（B樹）：當(dāng)然上面說到了紅黑樹，性能非常高。以上圖為例，樹的高度最高才為4，共9條數(shù)據(jù)，但是對于Mysql數(shù)據(jù)庫，動則幾百萬條數(shù)據(jù)，幾千萬條數(shù)據(jù)，那樹的高度就不可估量了，比如說上百萬條數(shù)據(jù)需要經(jīng)過30-50次磁盤IO才能查詢到數(shù)據(jù)，甚至更多的次數(shù)，顯然不能滿足Mysql索引高效的查詢效率。那如果我們控制樹的高度呢，那這樣就會極大減少了請求磁盤IO的請求次數(shù)，如果高度控制在4，那只需要經(jīng)過4次磁盤IO就可以查詢到數(shù)據(jù)。
但是怎么樣控制樹的高度呢，紅黑樹是每個節(jié)點只存儲一個元素，如果每個節(jié)點存多個元素呢，這樣就可以解決高度問題了，肯定有同學(xué)有疑問，把所有的元素都放到一個節(jié)點上，那高度值就是1了，不是更快嗎？這樣想肯定是錯的，Mysql每一次跟磁盤IO打交道是有大小限制的，Mysql限制每一個節(jié)點的大小是16K。 想查看自己Mysql限制節(jié)點大小的同學(xué)可以執(zhí)行下面的sql。
show global status like ‘Innodb_page_size’
下面以圖為例體現(xiàn)BTree
Mysql索引底層及優(yōu)化方法是什么 BTree特點如下：
1.所有索引元素不重復(fù)
2.節(jié)點的數(shù)據(jù)索引從左到右依次遞增
3.葉節(jié)點具有相同的深度，葉節(jié)點的指針為空
4.葉子節(jié)點和非葉子結(jié)點都存儲索引和數(shù)據(jù)

5） B+樹：上面說到了BTree控制了樹的高度的問題，可以滿足Mysql對于索引的需求，但是最終Mysq索引實現(xiàn)不是BTree而是B+樹，Mysql對B樹做了一點點改造，得到了B+樹，也可以理解為B+樹是B樹的升級版。
下面以圖為例說明：
Mysql索引底層及優(yōu)化方法是什么

從這張圖可以看到，我們的非葉子節(jié)點只存儲了索引并沒有存儲data，而且葉子節(jié)點間用指針相連。B樹的葉子節(jié)點和非葉子節(jié)點都存儲了索引和數(shù)據(jù)，而且葉子結(jié)點的指針為空，B+樹把數(shù)據(jù)放在了葉子節(jié)點上，這樣非葉子節(jié)點就可以存放更多的索引，每次從磁盤IO也能獲取更多的索引。
B+樹特點如下：
1.非葉子節(jié)點不存儲data，只存儲索引(冗余)和下層指針，可以放更多的索引
2.葉子節(jié)點包含所有索引字段，和數(shù)據(jù)
3.葉子節(jié)點用雙指針連接，提高區(qū)間訪問的性能

在百度上和很多博客上畫的B+樹是錯誤的哦，一定要避坑哦。
有興趣看Mysql官方對B+樹的解釋的可以去看看。
鏈接: Mysql官網(wǎng).

四.索引分類

1.按照索引的存儲關(guān)聯(lián)分類：分為兩大類
1.）聚集索義（聚簇索引）：葉節(jié)點包含了完整的數(shù)據(jù)記錄，不需要回表。
2.）非聚集索引：需要回表，二次查樹，影響性能。

1.1） 大家都知道Mysql常用的存儲引擎有兩種MyISAM和InnoDB，但是大家實際了解過兩種存儲引擎底層的數(shù)據(jù)存儲結(jié)構(gòu)嗎？
下面以圖為例為大家說明：
Mysql索引底層及優(yōu)化方法是什么其中test.myisam表是MyISAM存儲引擎，actor表是InnoDB存儲引擎，可以看到MyISAM存儲引擎有三個文件，分別是frm、MYD、MYI，很容易理解frm-frame的簡稱，存的是表的結(jié)構(gòu)，MYD-MYData存的是數(shù)據(jù)，MYI-MYIndex存的是索引，索引和數(shù)據(jù)是分開存儲的，再看InnoDB只有frm、IBD，其中frm一樣也是存的表的結(jié)構(gòu)，IBD文件存的是索引和數(shù)據(jù)，這點InnoDB和MyISAM不一樣。
下面以圖為例說明MyISAM存儲引擎主鍵索引是需要回表操作（非聚集索引）
Mysql索引底層及優(yōu)化方法是什么其中15存的是主鍵索引，0x07存的是15所在行記錄的磁盤文件地址指針，比如我們想找到15的數(shù)據(jù)，那首先應(yīng)該先通過主鍵索引樹，找到15所對應(yīng)的指針，然后找到了這個指針再去MyD文件中找具體的數(shù)據(jù)，需要進(jìn)行二次查找，這個過程稱為回表操作。
2.1） 下面以圖為例說明InnoDB存儲引擎主鍵索引不需要進(jìn)行回表操作。（聚集索引）
Mysql索引底層及優(yōu)化方法是什么 InnoDB存儲引擎子節(jié)點首先15那一行存放的是索引，15下面的那一列存放的是索引所在行的其他所有字段，如果我們想要查15的數(shù)據(jù)，直接就可以找到，不需要在經(jīng)過二次查樹。

2. 按照功能分類：主要分為五大類
2.1 主鍵索引：InnoDB主鍵索引不需要回表操作
2.2 普通索引（二級索引）：InnoDB普通索引需要回表操作，對于二級索引，會默認(rèn)和主鍵做聯(lián)合索引。
2.3 唯一索引
2.4 全文索引
2.5 聯(lián)合索引：需要滿足最左前綴原則

3. 在2.2中提到了普通索引需要回表操作，那有沒有不需要回表的普通索引呢，答案是有的，在某個查詢里面，索引已經(jīng)覆蓋了我們的查詢需求，我們稱為覆蓋索引。這時是不需要回表操作的。
由于覆蓋索引可以減少樹的搜索次數(shù)，顯著提升查詢性能，所以使用覆蓋索引是一個常用的性能優(yōu)化手段。

舉個例子：下面是這個表的初始化語句。

mysql> create table T (
ID int primary key,
k int NOT NULL DEFAULT 0, 
s varchar(16) NOT NULL DEFAULT '',
index k(k))
engine=InnoDB;

insert into T values(100,1, 'aa'),(200,2,'bb'),
(300,3,'cc'),(500,5,'ee'),(600,6,'ff'),(700,7,'gg');

在上面這個表 T 中，如果我執(zhí)行 select * from T where k between 3 and 5，需要執(zhí)行幾次樹的搜索操作，會掃描多少行？
現(xiàn)在，我們一起來看看這條 SQL 查詢語句的執(zhí)行流程?？聪聢D。
Mysql索引底層及優(yōu)化方法是什么
1.） 在 k 索引樹上找到 k=3 的記錄，取得 ID = 300；
2.） 再到 ID 索引樹查到 ID=300 對應(yīng)的 R3；
3.） 在 k 索引樹取下一個值 k=5，取得 ID=500；
4.） 再回到 ID 索引樹查到 ID=500 對應(yīng)的 R4；
5.） 在 k 索引樹取下一個值 k=6，不滿足條件，循環(huán)結(jié)束。

在這個過程中，回到主鍵索引樹搜索的過程，我們稱為回表。可以看到，這個查詢過程讀了 k 索引樹的 3 條記錄（步驟 1、3 和 5），回表了兩次（步驟 2 和 4）。

在這個例子中，由于查詢結(jié)果所需要的數(shù)據(jù)只在主鍵索引上有，所以不得不回表。

如果執(zhí)行的語句是 select ID from T where k between 3 and 5，這時只需要查 ID 的值，而 ID 的值已經(jīng)在 k 索引樹上了，因此可以直接提供查詢結(jié)果，不需要回表。也就是說，在這個查詢里面，索引 k 已經(jīng)“覆蓋了”我們的查詢需求，我們稱為覆蓋索引。

在 InnoDB 中，表都是根據(jù)主鍵順序以索引的形式存放的，這種存儲方式的表稱為索引組織表。又因為前面我們提到的，InnoDB 使用了 B+ 樹索引模型，所以數(shù)據(jù)都是存儲在 B+ 樹中的。每一個索引在 InnoDB 里面對應(yīng)一棵 B+ 樹。

五.索引優(yōu)化

1.上面描述了索引基本概念、分類以及底層的基本結(jié)構(gòu)相關(guān)知識。下面聊一聊索引優(yōu)化的相關(guān)知識吧。

1.） 當(dāng)組合索引中只要有一列含有null值，索引失效
2.） 在列上做計算索引失效，范圍之后的索引全部失效
3.） 在查詢條件上使用函數(shù)會造成索引失效
4.） 在where字句中使用 != 或 <> 操作符，導(dǎo)致索引失效
5.） 避免使用or，導(dǎo)致索引失效
6.） 使用模糊查詢也會造成索引失效，可以用like ‘a(chǎn)%’而不是like ‘%a%’
7.） 盡量使用覆蓋索引，減少 select * 語句
8.） 滿足最左前綴法則，最左前列開始并且不跳過索引中的列
9.） 字符串不加單引號索引失效

2.下面以實戰(zhàn)說明索引優(yōu)化。

新創(chuàng)建一個員工表，有5個屬性，如下。

create table employees(
id int primary key auto_increment comment '主鍵自增',
name varchar(30) not null default '' comment'名字',
age int not null default 1 comment '年齡',
id_card varchar(40) not null default '' comment '身份證號',
position varchar(40) not null default '' comment '位置'
);

-- 創(chuàng)建聯(lián)合索引
create index name_index on employees (name,age,position);

-- 插入一條數(shù)據(jù)
insert into employees(name,age,id_card,position) values('張三',15,
'201124199011035321','北京');

--  下面以10條sql測試，注意建立的聯(lián)合索引順序是 name，age，position
1.explain select * from employees where age=15 and position='北京' and name='張三';

2.explain select * from employees where name='張三' and age=15 and position='北京';

3.explain select * from employees where age=15 and name='張三';

4.explain select * from employees where position='北京' and name='張三';

5.explain select * from employees where position='北京' and age=15;

6.explain select * from employees where position='北京' and age>15 and name='張三';

7.explain select * from employees where position='北京';

8.explain select * from employees where age=15;

9.explain select * from employees where name='張三';

10.explain select * from employees where name != '張三';

以上10條sql有哪些是索引失效，有哪些是索引沒有失效的呢？
相信同學(xué)們已經(jīng)有了答案，但是答案對不對呢，下面我們一起分析下。
首先說第1條，查詢條件把3個索引全部用上了，但是索引的順序有變化，由name，age，position變成
了age，position，name，想到這里肯定有很多同學(xué)給出的答案就是索引失效，但是事實證明這個結(jié)果
是錯的，索引生效，肯定有很多同學(xué)疑惑，為什么呢，這條sql不滿足最左原則法則呀，這就要涉及到sql
的執(zhí)行流程了，這里博主簡單說下，sql執(zhí)行有1個優(yōu)化器的過程，優(yōu)化器的作用之一就是索引的選擇優(yōu)化，
所以優(yōu)化器幫我們把索引的順序變成正確的了，所以索引生效。
下面是第1條按照索引順序sql和第2條沒有按照索引順序sql的執(zhí)行結(jié)果。

執(zhí)行結(jié)果入下圖：可以發(fā)現(xiàn)全部生效。

第1條sql type的值為ref、字節(jié)是288 并且ref有3個const，全部生效。

Mysql索引底層及優(yōu)化方法是什么
第2條sql type的值為ref、字節(jié)是288 并且ref有3個const，全部生效。

Mysql索引底層及優(yōu)化方法是什么

想學(xué)習(xí)sql的執(zhí)行流程的可以看博主的另一篇關(guān)于sql執(zhí)行流程的文章哦。
有的同學(xué)有疑問了，那最左原則沒有用了嗎？
答案：有用的。

現(xiàn)在我們說下第3、4、5條sql
第3條：
explain select * from employees where age=15 and name='張三';
sql在執(zhí)行的時候，優(yōu)化器替我們把索引的順序優(yōu)化了，由 age -> name 變成 name -> age，這時
索引是生效的。
第4條：
explain select * from employees where position='北京' and name='張三';
索引順序優(yōu)化為name - > position,但是這時索引只有name索引生效，position沒有生效，因為我
們建立的索引順序是 name  -> age - > position，你會發(fā)現(xiàn)跳過了age，索引本質(zhì)也是一棵樹，少
了一個節(jié)點，下面的索引當(dāng)然不會生效了，這就沒有滿足最左原則法則。
第5條：
explain select * from employees where position='北京' and age=15;
這就和第4條sql一樣的道理了，第一個索引都不見了，后面的不可能生效。

執(zhí)行結(jié)果如下：

可以發(fā)現(xiàn)第3條sql type的值為ref、字節(jié)是126并且ref有2個const，全部生效。

Mysql索引底層及優(yōu)化方法是什么
第4條sql只有122字節(jié)并且ref只有1個const，只有name索引生效。

Mysql索引底層及優(yōu)化方法是什么
第5條sql type的值為all，字節(jié)和ref都是空，全部失效。

Mysql索引底層及優(yōu)化方法是什么

下面說第6條sql，剩下的sql都是和之前的sql一樣的道理。
explain select * from employees where position='北京' and age>15 and name='張三';
這條sql我們會發(fā)現(xiàn)，把索引字段全部使用了并且當(dāng)作條件查詢，不一樣的是age是范圍查找，優(yōu)化器替我
們把索引順序優(yōu)化成 name  -> age - > position ，按照我們索引優(yōu)化第2條：在列上做計算索引失效，范圍之后的索引全部失效，想必答案同學(xué)們都知道了。

執(zhí)行結(jié)果如下：

第6條sql只有126字節(jié)并且type的值為range，范圍查找，只有name和age索引生效。

Mysql索引底層及優(yōu)化方法是什么

以上就是“Mysql索引底層及優(yōu)化方法是什么”這篇文章的所有內(nèi)容，感謝各位的閱讀！相信大家閱讀完這篇文章都有很大的收獲，小編每天都會為大家更新不同的知識，如果還想學(xué)習(xí)更多的知識，請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

Mysql索引底層及優(yōu)化方法是什么

一.首先我們說下什么是索引，為什么要用索引

二. 索引類型分為兩類：

1.hash索引

2.bTree

三.下面我們簡單分析一下hash索引和bTree索引。

四.索引分類

五.索引優(yōu)化

1.上面描述了索引基本概念、分類以及底層的基本結(jié)構(gòu)相關(guān)知識。下面聊一聊索引優(yōu)化的相關(guān)知識吧。

2.下面以實戰(zhàn)說明索引優(yōu)化。

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

一.首先我們說下什么是索引，為什么要用索引

三.下面我們簡單分析一下hash索引和bTree索引。

1.上面描述了索引基本概念、分類以及底層的基本結(jié)構(gòu)相關(guān)知識。下面聊一聊索引優(yōu)化的相關(guān)知識吧。

2.下面以實戰(zhàn)說明索引優(yōu)化。