溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

MySQL中order?by的執(zhí)行過(guò)程是什么

發(fā)布時(shí)間:2022-06-02 14:11:11 來(lái)源:億速云 閱讀:96 作者:iii 欄目:開(kāi)發(fā)技術(shù)

本文小編為大家詳細(xì)介紹“MySQL中order by的執(zhí)行過(guò)程是什么”,內(nèi)容詳細(xì),步驟清晰,細(xì)節(jié)處理妥當(dāng),希望這篇“MySQL中order by的執(zhí)行過(guò)程是什么”文章能幫助大家解決疑惑,下面跟著小編的思路慢慢深入,一起來(lái)學(xué)習(xí)新知識(shí)吧。

一 、測(cè)試數(shù)據(jù)

測(cè)試的這個(gè)訂單表my_order的結(jié)構(gòu)是這樣的:

CREATE TABLE `my_order` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `oid` varchar(20) NOT NULL,
  `uid` int(11) NOT NULL,
  `price` decimal(6,2) NOT NULL DEFAULT '0.00',
  PRIMARY KEY (`id`) USING BTREE,
  KEY `uid` (`uid`) USING BTREE,
  KEY `oid` (`oid`)
) ENGINE=InnoDB AUTO_INCREMENT=1000000 DEFAULT CHARSET=utf8;

MySQL中order?by的執(zhí)行過(guò)程是什么

用戶(hù)表my_user數(shù)據(jù):

MySQL中order?by的執(zhí)行過(guò)程是什么

上面的訂單表my_order的uid 與 用戶(hù)表my_user的id 關(guān)聯(lián)。

SQL 語(yǔ)句可以這么寫(xiě):

SELECT
	oid,
	price 
FROM
	my_order 
WHERE
	uid = 1 
ORDER BY
	price 
	LIMIT 1000;

上面的SQL語(yǔ)句看上去邏輯很清晰,但是它的執(zhí)行流程了解么?這篇文章就來(lái)學(xué)習(xí)一下這個(gè)語(yǔ)句是怎么執(zhí)行的,以及有哪些參數(shù)會(huì)影響執(zhí)行。

二、 全字段排序

為避免全表掃描,我們需要在 uid 字段加上索引。在 uid 字段加上索引之后,我們用 EXPLAIN 命令來(lái)看看這個(gè)語(yǔ)句的執(zhí)行情況。

MySQL中order?by的執(zhí)行過(guò)程是什么

Extra 這個(gè)字段中的“Using filesort”表示的就是需要排序,MySQL 會(huì)給每個(gè)線(xiàn)程分配一塊內(nèi)存用于排序,稱(chēng)為 sort_buffer。為了說(shuō)明這個(gè) SQL 查詢(xún)語(yǔ)句的執(zhí)行過(guò)程,我們先看一下 uid 這個(gè)索引的示意圖。

如下圖所示:

MySQL中order?by的執(zhí)行過(guò)程是什么

通常情況下,這個(gè)語(yǔ)句執(zhí)行流程如下 :

  • 初始化 sort_buffer,確定放入 oid、price、uid 這三個(gè)字段;

  • 從索引 uid 找到第一個(gè)滿(mǎn)足 uid = 1 條件的主鍵 id,也就是圖中的 ID-4;

  • 到主鍵 id 索引取出整行,取 oid、price、uid 三個(gè)字段的值,存入 sort_buffer 中;

  • 從索引 uid 取下一個(gè)記錄的主鍵 id;

  • 重復(fù)步驟 3、4 直到 uid 的值不滿(mǎn)足查詢(xún)條件為止;

  • 對(duì) sort_buffer 中的數(shù)據(jù)按照字段 oid 做快速排序;

  • 按照排序結(jié)果取前 1000 行返回給客戶(hù)端。

“按 oid 排序”這個(gè)動(dòng)作,可能在內(nèi)存中完成,也可能需要使用外部排序,這取決于排序所需的內(nèi)存和參數(shù) sort_buffer_size。

sort_buffer_size,就是 MySQL 為排序開(kāi)辟的內(nèi)存(sort_buffer)的大小。如果要排序的數(shù)據(jù)量小于 sort_buffer_size,排序就在內(nèi)存中完成。但如果排序數(shù)據(jù)量太大,內(nèi)存放不下,則不得不利用磁盤(pán)臨時(shí)文件輔助排序。

你可以用下面介紹的方法,來(lái)確定一個(gè)排序語(yǔ)句是否使用了臨時(shí)文件。

/* 打開(kāi) optimizer_trace,只對(duì)本線(xiàn)程有效 */
SET optimizer_trace = 'enabled=on';
 
/* @a 保存 Innodb_rows_read 的初始值 */
SELECT VARIABLE_VALUE INTO @a FROM PERFORMANCE_SCHEMA.session_status WHERE variable_name='Innodb_rows_read';
 
/* 執(zhí)行語(yǔ)句 */
SELECT oid,price FROM my_order WHERE uid=1 ORDER BY price LIMIT 1000;
 
/* 查看 OPTIMIZER_TRACE 輸出 */
SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G;
 
/* @b 保存 Innodb_rows_read 的當(dāng)前值 */
SELECT VARIABLE_VALUE INTO @b FROM PERFORMANCE_SCHEMA.session_status WHERE variable_name='Innodb_rows_read';
 
/* 計(jì)算 Innodb_rows_read 差值 */
SELECT @b-@a;

這個(gè)方法是通過(guò)查看 OPTIMIZER_TRACE 的結(jié)果來(lái)確認(rèn)的,你可以從number_of_tmp_files 中看到是否使用了臨時(shí)文件。

MySQL中order?by的執(zhí)行過(guò)程是什么

number_of_tmp_files 表示排序過(guò)程中使用的臨時(shí)文件數(shù)。你一定奇怪,我當(dāng)前測(cè)試的需要 0 個(gè)文件,表示排序可以直接在內(nèi)存中完成。如果是 n,則表示內(nèi)存放不下時(shí),就需要使用外部排序,外部排序一般使用歸并排序算法??珊?jiǎn)單理解,MySQL 將需要排序的數(shù)據(jù)分成 n 份,每一份單獨(dú)排序后存在這些臨時(shí)文件中。然后把這 n 個(gè)有序文件再合并成一個(gè)有序的大文件。

注:當(dāng)如果sort_buffer_size超過(guò)了需要排序的數(shù)據(jù)量的大小,number_of_tmp_files 就是 0,表示排序可以直接在內(nèi)存中完成。

接下來(lái),我再和你解釋一下上圖中其他兩個(gè)值的意思。

我們的示例表中有 99972 條滿(mǎn)足 uid = 1 的記錄,examined_rows=99972,表示參與排序的行數(shù)是 99972 行。

sort_mode 里面是 additional_fields。

  • 1、< sort_key, rowid > 對(duì)應(yīng)的是MySQL 4.1之前的"原始排序模式"。表明排序緩沖區(qū)元組包含排序鍵值和原始表?的?id,排序后需要使??id進(jìn)?回表,這種算法也稱(chēng)為original filesort algorithm(回表排序算法);

  • 2、< sort_key, additional_fields > 對(duì)應(yīng)的是MySQL 4.1以后引入的"修改后排序模式"。排序緩沖區(qū)元組包含排序鍵值和查詢(xún)所需要的列,排序后直接從緩沖區(qū)元組取數(shù)據(jù),?需回表,這種算法也稱(chēng)為modified filesort algorithm(不回表排序);

  • 3、< sort_key, packed_additional_fields > 是MySQL 5.7.3以后引入的進(jìn)一步優(yōu)化的"打包數(shù)據(jù)排序模式"。這類(lèi)似上?種形式,但是附加的列(如varchar類(lèi)型)緊密地打包在?起,?不是使?固定長(zhǎng)度的編碼。

同時(shí),最后一個(gè)查詢(xún)語(yǔ)句 select @b-@a 的返回結(jié)果是 99973。

那為啥不是上面那個(gè) 99972 呢?

這里需要注意的是,為了避免干擾,你可以把 internal_tmp_disk_storage_engine 設(shè)置成 MyISAM。否則,select @b-@a 的結(jié)果會(huì)顯示為 99973。這是因?yàn)椴樵?xún) OPTIMIZER_TRACE 這個(gè)表時(shí),需要用到臨時(shí)表,而 internal_tmp_disk_storage_engine 的默認(rèn)值是 InnoDB。如果使用的是 InnoDB 引擎的話(huà),把數(shù)據(jù)從臨時(shí)表取出來(lái)的時(shí)候,會(huì)讓 Innodb_rows_read 的值加 1。

MySQL中order?by的執(zhí)行過(guò)程是什么

三、rowid 排序

上面那個(gè)算法,只對(duì)原表的數(shù)據(jù)讀了一遍,剩下的操作都是在 sort_buffer 和臨時(shí)文件中執(zhí)行的。但這個(gè)算法有一個(gè)問(wèn)題,就是如果查詢(xún)要返回的字段很多的話(huà),那么 sort_buffer 里面要放的字段數(shù)太多,這樣內(nèi)存里能夠同時(shí)放下的行數(shù)很少,要分成很多個(gè)臨時(shí)文件,排序的性能會(huì)很差。所以如果單行很大,這個(gè)方法效率不夠好。

如果 MySQL 認(rèn)為排序的單行長(zhǎng)度太大會(huì)怎么做呢?

下面來(lái)修改一個(gè)參數(shù),讓 MySQL 采用另外一種算法。

SET max_length_for_sort_data = 16;

max_length_for_sort_data,是 MySQL 中專(zhuān)門(mén)控制用于排序的行數(shù)據(jù)的長(zhǎng)度的一個(gè)參數(shù)。它的意思是,如果單行的長(zhǎng)度超過(guò)這個(gè)值,MySQL 就認(rèn)為單行太大,要換一個(gè)算法。oid、price這2個(gè)字段的定義總長(zhǎng)度是 28,我把 max_length_for_sort_data 設(shè)置為 16,我們?cè)賮?lái)看看計(jì)算過(guò)程有什么改變。新的算法放入 sort_buffer 的字段,只有要排序的列(即 price 字段)和主鍵 id。但這時(shí),排序的結(jié)果就因?yàn)樯倭?price 字段的值,不能直接返回了,

整個(gè)執(zhí)行流程就變成如下所示的樣子:

  • 初始化 sort_buffer,確定放入兩個(gè)字段,即 price 和 id;

  • 從索引 uid 找到第一個(gè)滿(mǎn)足 uid= 1 條件的主鍵 id;

  • 到主鍵 id 索引取出整行,取 price、id 這兩個(gè)字段,存入 sort_buffer 中;

  • 從索引 uid 取下一個(gè)記錄的主鍵 id;

  • 重復(fù)步驟 3、4 直到不滿(mǎn)足 uid= 1 條件為止;

  • 對(duì) sort_buffer 中的數(shù)據(jù)按照字段 price 進(jìn)行排序;

  • 遍歷排序結(jié)果,取前 1000 行,并按照 id 的值回到原表中取出 oid、price 2個(gè)字段返回給客戶(hù)端。

對(duì)比全字段排序流程圖,rowid 排序多訪(fǎng)問(wèn)了一次表 test 的主鍵索引,就是步驟 7。

說(shuō)明:最后的“結(jié)果集”只是一個(gè)邏輯概念,實(shí)際上 MySQL 服務(wù)端從排序后的 sort_buffer 中依次取出 id,然后到原表查到 oid、price 這2個(gè)字段的結(jié)果,不需要在服務(wù)端再耗費(fèi)內(nèi)存存儲(chǔ)結(jié)果,是直接返回給客戶(hù)端的。

那么根據(jù)這個(gè)時(shí)候執(zhí)行 select @b-@a,結(jié)果會(huì)是多少呢?

首先,圖中的 examined_rows 的值還是 99972,表示用于排序的數(shù)據(jù)是 99972 行。但是 select @b-@a 這個(gè)語(yǔ)句的值變成 100973 了。(比上面的 select @b-@a 99973 多了1000行,因?yàn)檫@時(shí)候除了排序過(guò)程外,在排序完成后,還要根據(jù) id 去原表取值。由于語(yǔ)句是 limit 1000,因此會(huì)多讀 1000 行)。

MySQL中order?by的執(zhí)行過(guò)程是什么

MySQL中order?by的執(zhí)行過(guò)程是什么

從 OPTIMIZER_TRACE 的結(jié)果中,你還能看到另外有個(gè)信息也變了。

  • sort_mode 變成了 <sort_key, rowid>,表示參與排序的只有 price 和 id 這兩個(gè)字段。

四、全字段排序 與 rowid 排序 比較

如果 MySQL 實(shí)在是擔(dān)心排序內(nèi)存太小,會(huì)影響排序效率,才會(huì)采用 rowid 排序算法,這樣排序過(guò)程中一次可以排序更多行,但是需要再回到原表去取數(shù)據(jù)。

如果 MySQL 認(rèn)為內(nèi)存足夠大,會(huì)優(yōu)先選擇全字段排序,把需要的字段都放到 sort_buffer 中,這樣排序后就會(huì)直接從內(nèi)存里面返回查詢(xún)結(jié)果了,不用再回到原表去取數(shù)據(jù)。這也就體現(xiàn)了 MySQL 的一個(gè)設(shè)計(jì)思想:如果內(nèi)存夠,就要多利用內(nèi)存,盡量減少磁盤(pán)訪(fǎng)問(wèn)。對(duì)于 InnoDB 表來(lái)說(shuō),rowid 排序會(huì)要求回表多造成磁盤(pán)讀,因此不會(huì)被優(yōu)先選擇。

MySQL 做排序是一個(gè)成本比較高的操作。是不是所有的 order by 都需要排序操作呢?如果不排序就能得到正確的結(jié)果,那對(duì)系統(tǒng)的消耗會(huì)小很多,語(yǔ)句的執(zhí)行時(shí)間也會(huì)變得更短。其實(shí),并不是所有的 order by 語(yǔ)句,都需要排序操作的。從上面分析的執(zhí)行過(guò)程,我們可以看到,MySQL 之所以需要生成臨時(shí)表,并且在臨時(shí)表上做排序操作,其原因是原來(lái)的數(shù)據(jù)都是無(wú)序的。如果能夠保證從 uid 這個(gè)索引上取出來(lái)的行,天然就是按照 price 遞增排序的話(huà),是不是就可以不用再排序了呢?所以,我們可以在這個(gè)市民表上創(chuàng)建一個(gè) uid 和 price 的聯(lián)合索引,對(duì)應(yīng)的 SQL 語(yǔ)句是:

ALTER TABLE my_order ADD INDEX un_key (uid,price);

作為與 uid 索引的對(duì)比,我們來(lái)看看這個(gè)索引的示意圖。

MySQL中order?by的執(zhí)行過(guò)程是什么

在這個(gè)索引里面,我們依然可以用樹(shù)搜索的方式定位到第一個(gè)滿(mǎn)足 uid=1 的記錄,并且額外確保了,接下來(lái)按順序取“下一條記錄”的遍歷過(guò)程中,只要 uid 的值是 1,price 的值就一定是有序的。

這樣整個(gè)查詢(xún)過(guò)程的流程就變成了:

  • 從索引 (uid,price) 找到第一個(gè)滿(mǎn)足 city= 1 條件的主鍵 id;

  • 到主鍵 id 索引取出整行,取 oid、price 2個(gè)字段的值,作為結(jié)果集的一部分直接返回;

  • 從索引 (uid,price) 取下一個(gè)記錄主鍵 id;

  • 重復(fù)步驟 2、3,直到查到第 1000 條記錄,或者是不滿(mǎn)足 uid=1 條件時(shí)循環(huán)結(jié)束。

這個(gè)查詢(xún)過(guò)程不需要臨時(shí)表,也不需要排序。接下來(lái),我們用 EXPLAIN 的結(jié)果來(lái)印證一下。

MySQL中order?by的執(zhí)行過(guò)程是什么

從圖中可以看到,Extra 字段中沒(méi)有 Using filesort 了,也就是不需要排序了。而且由于 (uid,price) 這個(gè)聯(lián)合索引本身有序,所以這個(gè)查詢(xún)也不用把 99972 行全都讀一遍,只要找到滿(mǎn)足條件的前 1000 條記錄就可以退出了。也就是說(shuō),在我們這個(gè)例子里,只需要掃描 1000 次。同樣看下 select @b-@a;

MySQL中order?by的執(zhí)行過(guò)程是什么

再稍微復(fù)習(xí)一下。覆蓋索引是指,索引上的信息足夠滿(mǎn)足查詢(xún)請(qǐng)求,不需要再回到主鍵索引上去取數(shù)據(jù)。Extra 字段里面多了“Using index”,表示的就是使用了覆蓋索引,性能上會(huì)快很多。

當(dāng)然,這里并不是說(shuō)要為了每個(gè)查詢(xún)能用上覆蓋索引,就要把語(yǔ)句中涉及的字段都建上聯(lián)合索引,畢竟索引還是有維護(hù)代價(jià)的。這是一個(gè)需要權(quán)衡的決定。

讀到這里,這篇“MySQL中order by的執(zhí)行過(guò)程是什么”文章已經(jīng)介紹完畢,想要掌握這篇文章的知識(shí)點(diǎn)還需要大家自己動(dòng)手實(shí)踐使用過(guò)才能領(lǐng)會(huì),如果想了解更多相關(guān)內(nèi)容的文章,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI