溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

發(fā)布時(shí)間:2020-08-09 10:46:00 來(lái)源:ITPUB博客 閱讀:163 作者:Java技術(shù)江湖 欄目:MySQL數(shù)據(jù)庫(kù)

本文轉(zhuǎn)自互聯(lián)網(wǎng)

本系列文章將整理到我在GitHub上的《Java面試指南》倉(cāng)庫(kù),更多精彩內(nèi)容請(qǐng)到我的倉(cāng)庫(kù)里查看

https://github.com/h3pl/Java-Tutorial

喜歡的話(huà)麻煩點(diǎn)下Star哈

文章首發(fā)于我的個(gè)人博客:

www.how2playlife.com

本文是微信公眾號(hào)【Java技術(shù)江湖】的《重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)》其中一篇,本文部分內(nèi)容來(lái)源于網(wǎng)絡(luò),為了把本文主題講得清晰透徹,也整合了很多我認(rèn)為不錯(cuò)的技術(shù)博客內(nèi)容,引用其中了一些比較好的博客文章,如有侵權(quán),請(qǐng)聯(lián)系作者。

該系列博文會(huì)告訴你如何從入門(mén)到進(jìn)階,從sql基本的使用方法,從MySQL執(zhí)行引擎再到索引、事務(wù)等知識(shí),一步步地學(xué)習(xí)MySQL相關(guān)技術(shù)的實(shí)現(xiàn)原理,更好地了解如何基于這些知識(shí)來(lái)優(yōu)化sql,減少SQL執(zhí)行時(shí)間,通過(guò)執(zhí)行計(jì)劃對(duì)SQL性能進(jìn)行分析,再到MySQL的主從復(fù)制、主備部署等內(nèi)容,以便讓你更完整地了解整個(gè)MySQL方面的技術(shù)體系,形成自己的知識(shí)框架。

如果對(duì)本系列文章有什么建議,或者是有什么疑問(wèn)的話(huà),也可以關(guān)注公眾號(hào)【Java技術(shù)江湖】聯(lián)系作者,歡迎你參與本系列博文的創(chuàng)作和修訂。

除非單表數(shù)據(jù)未來(lái)會(huì)一直不斷上漲,否則不要一開(kāi)始就考慮拆分,拆分會(huì)帶來(lái)邏輯、部署、運(yùn)維的各種復(fù)雜度,一般以整型值為主的表在 千萬(wàn)級(jí)以下,字符串為主的表在 五百萬(wàn)以下是沒(méi)有太大問(wèn)題的。而事實(shí)上很多時(shí)候MySQL單表的性能依然有不少優(yōu)化空間,甚至能正常支撐千萬(wàn)級(jí)以上的數(shù)據(jù)量:

字段

  • 盡量使用 TINYINT、 SMALLINT、 MEDIUM_INT作為整數(shù)類(lèi)型而非 INT,如果非負(fù)則加上 UNSIGNED

  • VARCHAR的長(zhǎng)度只分配真正需要的空間

  • 使用枚舉或整數(shù)代替字符串類(lèi)型

  • 盡量使用 TIMESTAMP而非 DATETIME,

  • 單表不要有太多字段,建議在20以?xún)?nèi)

  • 避免使用NULL字段,很難查詢(xún)優(yōu)化且占用額外索引空間

  • 用整型來(lái)存IP

索引

  • 索引并不是越多越好,要根據(jù)查詢(xún)有針對(duì)性的創(chuàng)建,考慮在 WHEREORDER BY命令上涉及的列建立索引,可根據(jù) EXPLAIN來(lái)查看是否用了索引還是全表掃描

  • 應(yīng)盡量避免在 WHERE子句中對(duì)字段進(jìn)行 NULL值判斷,否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描

  • 值分布很稀少的字段不適合建索引,例如”性別”這種只有兩三個(gè)值的字段

  • 字符字段只建前綴索引

  • 字符字段最好不要做主鍵

  • 不用外鍵,由程序保證約束

  • 盡量不用 UNIQUE,由程序保證約束

  • 使用多列索引時(shí)主意順序和查詢(xún)條件保持一致,同時(shí)刪除不必要的單列索引

查詢(xún)SQL

  • 可通過(guò)開(kāi)啟慢查詢(xún)?nèi)罩緛?lái)找出較慢的SQL

  • 不做列運(yùn)算: SELECT id WHERE age + 1 = 10,任何對(duì)列的操作都將導(dǎo)致表掃描,它包括數(shù)據(jù)庫(kù)教程函數(shù)、計(jì)算表達(dá)式等等,查詢(xún)時(shí)要盡可能將操作移至等號(hào)右邊

  • sql語(yǔ)句盡可能簡(jiǎn)單:一條sql只能在一個(gè)cpu運(yùn)算;大語(yǔ)句拆小語(yǔ)句,減少鎖時(shí)間;一條大sql可以堵死整個(gè)庫(kù)

  • 不用 SELECT *

  • OR改寫(xiě)成 INOR的效率是n級(jí)別, IN的效率是log(n)級(jí)別,in的個(gè)數(shù)建議控制在200以?xún)?nèi)

  • 不用函數(shù)和觸發(fā)器,在應(yīng)用程序?qū)崿F(xiàn)

  • 避免 %xxx式查詢(xún)

  • 少用 JOIN

  • 使用同類(lèi)型進(jìn)行比較,比如用 '123''123'比, 123123

  • 盡量避免在 WHERE子句中使用!=或<>操作符,否則將引擎放棄使用索引而進(jìn)行全表掃描

  • 對(duì)于連續(xù)數(shù)值,使用 BETWEEN不用 INSELECT id FROM t WHERE num BETWEEN 1 AND 5

  • 列表數(shù)據(jù)不要拿全表,要使用 LIMIT來(lái)分頁(yè),每頁(yè)數(shù)量也不要太大

引擎

目前廣泛使用的是MyISAM和InnoDB兩種引擎:

MyISAM

MyISAM引擎是MySQL 5.1及之前版本的默認(rèn)引擎,它的特點(diǎn)是:

  • 不支持行鎖,讀取時(shí)對(duì)需要讀到的所有表加鎖,寫(xiě)入時(shí)則對(duì)表加排它鎖

  • 不支持事務(wù)

  • 不支持外鍵

  • 不支持崩潰后的安全恢復(fù)

  • 在表有讀取查詢(xún)的同時(shí),支持往表中插入新紀(jì)錄

  • 支持 BLOBTEXT的前500個(gè)字符索引,支持全文索引

  • 支持延遲更新索引,極大提升寫(xiě)入性能

  • 對(duì)于不會(huì)進(jìn)行修改的表,支持壓縮表,極大減少磁盤(pán)空間占用

InnoDB

InnoDB在MySQL 5.5后成為默認(rèn)索引,它的特點(diǎn)是:

  • 支持行鎖,采用MVCC來(lái)支持高并發(fā)

  • 支持事務(wù)

  • 支持外鍵

  • 支持崩潰后的安全恢復(fù)

  • 不支持全文索引

總體來(lái)講,MyISAM適合 SELECT密集型的表,而InnoDB適合 INSERTUPDATE密集型的表

0、自己寫(xiě)的海量數(shù)據(jù)sql優(yōu)化實(shí)踐

首先是建表和導(dǎo)數(shù)據(jù)的過(guò)程。

參考 https://nsimple.top/archives/mysql-create-million-data.html

有時(shí)候我們需要對(duì)大數(shù)據(jù)進(jìn)行測(cè)試,本地一般沒(méi)有那么多數(shù)據(jù),就需要我們自己生成一些。下面會(huì)借助內(nèi)存表的特點(diǎn)進(jìn)行生成百萬(wàn)條測(cè)試數(shù)據(jù)。

  1. 創(chuàng)建一個(gè)臨時(shí)內(nèi)存表, 做數(shù)據(jù)插入的時(shí)候會(huì)比較快些

SQL

-- 創(chuàng)建一個(gè)臨時(shí)內(nèi)存表DROP TABLE IF EXISTS `vote_record_memory`;CREATE TABLE `vote_record_memory` (    `id` int(10) unsigned NOT NULL AUTO_INCREMENT,    `user_id` varchar(20) NOT NULL DEFAULT '',    `vote_num` int(10) unsigned NOT NULL DEFAULT '0',    `group_id` int(10) unsigned NOT NULL DEFAULT '0',    `status` tinyint(2) unsigned NOT NULL DEFAULT '1',    `create_time` datetime NOT NULL DEFAULT '0000-00-00 00:00:00',    PRIMARY KEY (`id`),    KEY `index_user_id` (`user_id`) USING HASH) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8;
  1. — 創(chuàng)建一個(gè)普通表,用作模擬大數(shù)據(jù)的測(cè)試用例

SQL

DROP TABLE IF EXISTS `vote_record`;CREATE TABLE `vote_record` (    `id` int(10) unsigned NOT NULL AUTO_INCREMENT,    `user_id` varchar(20) NOT NULL DEFAULT '' COMMENT '用戶(hù)Id',    `vote_num` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '投票數(shù)',    `group_id` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '用戶(hù)組id 0-未激活用戶(hù) 1-普通用戶(hù) 2-vip用戶(hù) 3-管理員用戶(hù)',    `status` tinyint(2) unsigned NOT NULL DEFAULT '1' COMMENT '狀態(tài) 1-正常 2-已刪除',    `create_time` int(10) unsigned NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT '創(chuàng)建時(shí)間',    PRIMARY KEY (`id`),    KEY `index_user_id` (`user_id`) USING HASH COMMENT '用戶(hù)ID哈希索引') ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='投票記錄表';
  1. 為了數(shù)據(jù)的隨機(jī)性和真實(shí)性,我們需要?jiǎng)?chuàng)建一個(gè)可生成長(zhǎng)度為n的隨機(jī)字符串的函數(shù)。

SQL

-- 創(chuàng)建生成長(zhǎng)度為n的隨機(jī)字符串的函數(shù)DELIMITER // -- 修改MySQL delimiter:'//'DROP FUNCTION IF EXISTS `rand_string` //SET NAMES utf8 //CREATE FUNCTION `rand_string` (n INT) RETURNS VARCHAR(255) CHARSET 'utf8'BEGIN     DECLARE char_str varchar(100) DEFAULT 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789';    DECLARE return_str varchar(255) DEFAULT '';    DECLARE i INT DEFAULT 0;    WHILE i < n DO        SET return_str = concat(return_str, substring(char_str, FLOOR(1 + RAND()*62), 1));        SET i = i+1;    END WHILE;    RETURN return_str;END //
  1. 為了操作方便,我們?cè)賱?chuàng)建一個(gè)插入數(shù)據(jù)的存儲(chǔ)過(guò)程

SQL

-- 創(chuàng)建插入數(shù)據(jù)的存儲(chǔ)過(guò)程DROP PROCEDURE IF EXISTS `add_vote_record_memory` //CREATE PROCEDURE `add_vote_record_memory`(IN n INT)BEGIN    DECLARE i INT DEFAULT 1;    DECLARE vote_num INT DEFAULT 0;    DECLARE group_id INT DEFAULT 0;    DECLARE status TINYINT DEFAULT 1;    WHILE i < n DO        SET vote_num = FLOOR(1 + RAND() * 10000);        SET group_id = FLOOR(0 + RAND()*3);        SET status = FLOOR(1 + RAND()*2);        INSERT INTO `vote_record_memory` VALUES (NULL, rand_string(20), vote_num, group_id, status, NOW());        SET i = i + 1;    END WHILE;END //DELIMITER ;  -- 改回默認(rèn)的 MySQL delimiter:';'
  1. 開(kāi)始執(zhí)行存儲(chǔ)過(guò)程,等待生成數(shù)據(jù)(10W條生成大約需要40分鐘)

SQL

-- 調(diào)用存儲(chǔ)過(guò)程 生成100W條數(shù)據(jù)CALL add_vote_record_memory(1000000);
  1. 查詢(xún)內(nèi)存表已生成記錄(為了下步測(cè)試,目前僅生成了105645條)

SQL

SELECT count(*) FROM `vote_record_memory`;-- count(*)-- 105646
  1. 把數(shù)據(jù)從內(nèi)存表插入到普通表中(10w條數(shù)據(jù)13s就插入完了)

SQL

INSERT INTO vote_record SELECT * FROM `vote_record_memory`;
  1. 查詢(xún)普通表已的生成記錄

SQL

SELECT count(*) FROM `vote_record`;-- count(*)-- 105646
  1. 如果一次性插入普通表太慢,可以分批插入,這就需要寫(xiě)個(gè)存儲(chǔ)過(guò)程了:

SQL

-- 參數(shù)n是每次要插入的條數(shù)-- lastid是已導(dǎo)入的最大idCREATE PROCEDURE `copy_data_from_tmp`(IN n INT)BEGIN    DECLARE lastid INT DEFAULT 0;    SELECT MAX(id) INTO lastid FROM `vote_record`;    INSERT INTO `vote_record` SELECT * FROM `vote_record_memory` where id > lastid LIMIT n;END
  1. 調(diào)用存儲(chǔ)過(guò)程:

SQL

-- 調(diào)用存儲(chǔ)過(guò)程 插入60w條CALL copy_data_from_tmp(600000);

SELECT * FROM vote_record;

全表查詢(xún)

建完表以后開(kāi)啟慢查詢(xún)?nèi)罩荆唧w參考下面的例子,然后學(xué)會(huì)用explain。windows慢日志的位置在c盤(pán),另外,使用client工具也可以記錄慢日志,所以不一定要用命令行來(lái)執(zhí)行測(cè)試,否則大表數(shù)據(jù)在命令行中要顯示的非常久。

1 全表掃描select * from vote_record


慢日志

SET timestamp=1529034398; select * from vote_record;

Time: 2018-06-15T03:52:58.804850Z

User @Host: root[root] @ localhost [::1] Id: 74

Query_time: 3.166424 Lock_time: 0.000000 Rows_sent: 900500 Rows_examined: 999999

耗時(shí)3秒,我設(shè)置的門(mén)檻是一秒。所以記錄了下來(lái)。

explain執(zhí)行計(jì)劃

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N ALL \N \N \N \N 996507 100.00 \N

全表掃描耗時(shí)3秒多,用不到索引。

2 select * from vote_record where vote_num > 1000

沒(méi)有索引,所以相當(dāng)于全表掃描,一樣是3.5秒左右

3 select * from vote_record where vote_num > 1000

加索引create

CREATE INDEX vote ON vote_record(vote_num);

explain查看執(zhí)行計(jì)劃

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N ALL votenum,vote \N \N \N 996507 50.00 Using where

還是沒(méi)用到索引,因?yàn)椴环献钭笄熬Y匹配。查詢(xún)需要3.5秒左右

最后修改一下sql語(yǔ)句

EXPLAIN SELECT * FROM vote_record WHERE id > 0 AND vote_num > 1000;

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N range PRIMARY,votenum,vote PRIMARY 4 \N 498253 50.00 Using where

用到了索引,但是只用到了主鍵索引。再修改一次

EXPLAIN SELECT * FROM vote_record WHERE id > 0 AND vote_num = 1000;

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N index_merge PRIMARY,votenum,vote votenum,PRIMARY 8,4 \N 51 100.00 Using intersect(votenum,PRIMARY); Using where

用到了兩個(gè)索引,votenum,PRIMARY。

這是為什么呢。

再看一個(gè)語(yǔ)句

EXPLAIN SELECT * FROM vote_record WHERE id = 1000 AND vote_num > 1000

id select_type table partitions type possible_keys key key_len ref rows filtered Extra

1 SIMPLE vote_record \N const PRIMARY,votenum PRIMARY 4 const 1 100.00 \N

也只有主鍵用到了索引。這是因?yàn)橹挥凶钭笄熬Y索引可以用>或<,其他索引用<或者>會(huì)導(dǎo)致用不到索引。

下面是幾個(gè)網(wǎng)上參考的例子:

一:索引是sql語(yǔ)句優(yōu)化的關(guān)鍵,學(xué)會(huì)使用慢日志和執(zhí)行計(jì)劃分析sql

背景:使用A電腦安裝mysql,B電腦通過(guò)xshell方式連接,數(shù)據(jù)內(nèi)容我都已經(jīng)創(chuàng)建好,現(xiàn)在我已正常的進(jìn)入到mysql中

步驟1:設(shè)置慢查詢(xún)?nèi)罩镜某瑫r(shí)時(shí)間,先查看日志存放路徑查詢(xún)慢日志的地址,因?yàn)橛新樵?xún)的內(nèi)容,就會(huì)到這個(gè)日志中:

show global variables like "%slow%";

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

2.開(kāi)啟慢查詢(xún)?nèi)罩?/p>

set global slow_query_log=on;

3.查看慢查詢(xún)?nèi)罩镜脑O(shè)置時(shí)間,是否是自己需要的

show global variables like "%long%";

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

4.如果不是自己想的時(shí)間,修改慢查詢(xún)時(shí)間,只要超過(guò)了以下的設(shè)置時(shí)間,查詢(xún)的日志就會(huì)到剛剛的日志中,我設(shè)置查詢(xún)時(shí)間超過(guò)1S就進(jìn)入到慢查詢(xún)?nèi)罩局?/p>

set global long_query_time=1;

5.大數(shù)據(jù)已準(zhǔn)備,進(jìn)行數(shù)據(jù)的查詢(xún),xshell最好開(kāi)兩個(gè)窗口,一個(gè)查看日志,一個(gè)執(zhí)行內(nèi)容

Sql查詢(xún)語(yǔ)句:select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M'

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

發(fā)現(xiàn)查數(shù)據(jù)的總時(shí)間去掉了17.74S

查看日志:打開(kāi)日志

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

標(biāo)記1:執(zhí)行的sql語(yǔ)句

標(biāo)記2:執(zhí)行sql的時(shí)間,我的是10點(diǎn)52執(zhí)行的

標(biāo)記3:使用那臺(tái)機(jī)器

標(biāo)記4:執(zhí)行時(shí)間,query_tims,查詢(xún)數(shù)據(jù)的時(shí)間

標(biāo)記5:不知道是干嘛的

標(biāo)記6:執(zhí)行耗時(shí)的sql語(yǔ)句,我在想我1的應(yīng)該是截取錯(cuò)了!但是記住最后一定是顯示耗時(shí)是因?yàn)閳?zhí)行什么sql造成的

6.執(zhí)行打印計(jì)劃,主要是查看是否使用了索引等其他內(nèi)容,主要就是在sql前面加上explain 關(guān)鍵字

explain select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M';

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

描述extra中,表示只使用了where條件,沒(méi)有其他什么索引之類(lèi)的

7.進(jìn)行sql優(yōu)化,建一個(gè)fist_name的索引,索引就是將你需要的數(shù)據(jù)先給篩選出來(lái),這樣就可以節(jié)省很多掃描時(shí)間

create index firstname on employees_tmp(first_name);

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

注:創(chuàng)建索引時(shí)會(huì)很慢,是對(duì)整個(gè)表做了一個(gè)復(fù)制功能,并進(jìn)行數(shù)據(jù)的一些分類(lèi)(我猜是這樣,所以會(huì)很慢)

8.查看建立的索引

show index from employees_tmp;

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

9.在執(zhí)行查詢(xún)語(yǔ)句,查看語(yǔ)句的執(zhí)行時(shí)間

select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M'

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

發(fā)現(xiàn)時(shí)間已經(jīng)有所提升了,其實(shí)選擇索引也不一開(kāi)始就知道,我們?cè)谠囋囀褂眯詣e,gender進(jìn)行索引

10.刪除已經(jīng)有的索引,刪除索引:

drop index first_name on employees_tmp;

11.創(chuàng)建性別的索引(性別是不怎么好的索引方式,因?yàn)橛泻芏嘀貜?fù)數(shù)據(jù))

create index index_gendar on employees_tmp(gender);

在執(zhí)行sql語(yǔ)句查詢(xún)數(shù)據(jù),查看查詢(xún)執(zhí)行時(shí)間,沒(méi)有創(chuàng)建比較優(yōu)秀的索引,導(dǎo)致查詢(xún)時(shí)間還變長(zhǎng)了,

為嘛還變長(zhǎng)了,這個(gè)我沒(méi)有弄懂

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

12.我們?cè)谠囋囀褂脛?chuàng)建組合索引,使用性別和姓名

alter table employees_tmp add index idx_union (first_name,gender);

在執(zhí)行sql查看sql數(shù)據(jù)的執(zhí)行時(shí)間

select sql_no_cache * from employees_tmp where first_name='Duangkaew' and gender='M'

速度提升了N多倍啊

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

查看創(chuàng)建的索引

show index from employees_tmp;

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

索引建的好真的一個(gè)好幫手,建不好就是費(fèi)時(shí)的一個(gè)操作

目前還不知道為什么建立性別的索引會(huì)這么慢

二:sql優(yōu)化注意要點(diǎn),比如索引是否用到,查詢(xún)優(yōu)化是否改變了執(zhí)行計(jì)劃,以及一些細(xì)節(jié)

場(chǎng)景

我用的數(shù)據(jù)庫(kù)是mysql5.6,下面簡(jiǎn)單的介紹下場(chǎng)景

課程表

create table Course( c_id int PRIMARY KEY, name varchar(10) )

數(shù)據(jù)100條

學(xué)生表:

create table Student( id int PRIMARY KEY, name varchar(10) )

數(shù)據(jù)70000條

學(xué)生成績(jī)表SC

CREATE table SC(     sc_id int PRIMARY KEY,     s_id int,     c_id int,     score int )

數(shù)據(jù)70w條

查詢(xún)目的:

查找語(yǔ)文考100分的考生

查詢(xún)語(yǔ)句:

select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 )

執(zhí)行時(shí)間:30248.271s

暈,為什么這么慢,先來(lái)查看下查詢(xún)計(jì)劃:

EXPLAIN  select s.* from Student s where s.s_id in (select s_id from SC sc where sc.c_id = 0 and sc.score = 100 )

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

發(fā)現(xiàn)沒(méi)有用到索引,type全是ALL,那么首先想到的就是建立一個(gè)索引,建立索引的字段當(dāng)然是在where條件的字段。

先給sc表的c_id和score建個(gè)索引

CREATE index sc_c_id_index on SC(c_id);
CREATE index sc_score_index on SC(score);

再次執(zhí)行上述查詢(xún)語(yǔ)句,時(shí)間為: 1.054s

快了3w多倍,大大縮短了查詢(xún)時(shí)間,看來(lái)索引能極大程度的提高查詢(xún)效率,看來(lái)建索引很有必要,很多時(shí)候都忘記建

索引了,數(shù)據(jù)量小的的時(shí)候壓根沒(méi)感覺(jué),這優(yōu)化感覺(jué)挺爽。

但是1s的時(shí)間還是太長(zhǎng)了,還能進(jìn)行優(yōu)化嗎,仔細(xì)看執(zhí)行計(jì)劃:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

查看優(yōu)化后的sql:

SELECT    `YSB`.`s`.`s_id` AS `s_id`,    `YSB`.`s`.`name` AS `name`FROM    `YSB`.`Student` `s`WHERE    < in_optimizer > (        `YSB`.`s`.`s_id` ,< EXISTS > (            SELECT                1            FROM                `YSB`.`SC` `sc`            WHERE                (                    (`YSB`.`sc`.`c_id` = 0)                    AND (`YSB`.`sc`.`score` = 100)                    AND (                        < CACHE > (`YSB`.`s`.`s_id`) = `YSB`.`sc`.`s_id`                    )                )        )    )

補(bǔ)充:這里有網(wǎng)友問(wèn)怎么查看優(yōu)化后的語(yǔ)句

方法如下:

在命令窗口執(zhí)行

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

有type=all

按照我之前的想法,該sql的執(zhí)行的順序應(yīng)該是先執(zhí)行子查詢(xún)

select s_id from SC sc where sc.c_id = 0 and sc.score = 100

耗時(shí):0.001s

得到如下結(jié)果:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

然后再執(zhí)行

select s.* from Student s where s.s_id in(7,29,5000)

耗時(shí):0.001s

這樣就是相當(dāng)快了啊,Mysql竟然不是先執(zhí)行里層的查詢(xún),而是將sql優(yōu)化成了exists子句,并出現(xiàn)了EPENDENT SUBQUERY,

mysql是先執(zhí)行外層查詢(xún),再執(zhí)行里層的查詢(xún),這樣就要循環(huán)70007*11=770077次。

那么改用連接查詢(xún)呢?

SELECT s.* from  Student s INNER JOIN SC sc on sc.s_id = s.s_id where sc.c_id=0 and sc.score=100

這里為了重新分析連接查詢(xún)的情況,先暫時(shí)刪除索引sc_c_id_index,sc_score_index

執(zhí)行時(shí)間是:0.057s

效率有所提高,看看執(zhí)行計(jì)劃:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

這里有連表的情況出現(xiàn),我猜想是不是要給sc表的s_id建立個(gè)索引

CREATE index sc_s_id_index on SC(s_id);

show index from SC

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

在執(zhí)行連接查詢(xún)

時(shí)間: 1.076s,竟然時(shí)間還變長(zhǎng)了,什么原因?查看執(zhí)行計(jì)劃:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

優(yōu)化后的查詢(xún)語(yǔ)句為:

SELECT    `YSB`.`s`.`s_id` AS `s_id`,    `YSB`.`s`.`name` AS `name`FROM    `YSB`.`Student` `s`JOIN `YSB`.`SC` `sc`WHERE    (        (            `YSB`.`sc`.`s_id` = `YSB`.`s`.`s_id`        )        AND (`YSB`.`sc`.`score` = 100)        AND (`YSB`.`sc`.`c_id` = 0)    )

貌似是先做的連接查詢(xún),再執(zhí)行的where過(guò)濾

回到前面的執(zhí)行計(jì)劃:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

這里是先做的where過(guò)濾,再做連表,執(zhí)行計(jì)劃還不是固定的,那么我們先看下標(biāo)準(zhǔn)的sql執(zhí)行順序:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

正常情況下是先join再where過(guò)濾,但是我們這里的情況,如果先join,將會(huì)有70w條數(shù)據(jù)發(fā)送join做操,因此先執(zhí)行where

過(guò)濾是明智方案,現(xiàn)在為了排除mysql的查詢(xún)優(yōu)化,我自己寫(xiě)一條優(yōu)化后的sql

SELECT    s.*FROM    (        SELECT            *        FROM            SC sc        WHERE            sc.c_id = 0        AND sc.score = 100    ) tINNER JOIN Student s ON t.s_id = s.s_id

即先執(zhí)行sc表的過(guò)濾,再進(jìn)行表連接,執(zhí)行時(shí)間為:0.054s

和之前沒(méi)有建s_id索引的時(shí)間差不多

查看執(zhí)行計(jì)劃:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

先提取sc再連表,這樣效率就高多了,現(xiàn)在的問(wèn)題是提取sc的時(shí)候出現(xiàn)了掃描表,那么現(xiàn)在可以明確需要建立相關(guān)索引

CREATE index sc_c_id_index on SC(c_id);
CREATE index sc_score_index on SC(score);

再執(zhí)行查詢(xún):

SELECT    s.*FROM    (        SELECT            *        FROM            SC sc        WHERE            sc.c_id = 0        AND sc.score = 100    ) tINNER JOIN Student s ON t.s_id = s.s_id

執(zhí)行時(shí)間為:0.001s,這個(gè)時(shí)間相當(dāng)靠譜,快了50倍

執(zhí)行計(jì)劃:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

我們會(huì)看到,先提取sc,再連表,都用到了索引。

那么再來(lái)執(zhí)行下sql

SELECT s.* from  Student s INNER JOIN SC sc on sc.s_id = s.s_id where sc.c_id=0 and sc.score=100

執(zhí)行時(shí)間0.001s

執(zhí)行計(jì)劃:

重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

這里是mysql進(jìn)行了查詢(xún)語(yǔ)句優(yōu)化,先執(zhí)行了where過(guò)濾,再執(zhí)行連接操作,且都用到了索引。

總結(jié):

1.mysql嵌套子查詢(xún)效率確實(shí)比較低

2.可以將其優(yōu)化成連接查詢(xún)

3.建立合適的索引

4.學(xué)會(huì)分析sql執(zhí)行計(jì)劃,mysql會(huì)對(duì)sql進(jìn)行優(yōu)化,所以分析執(zhí)行計(jì)劃很重要

由于時(shí)間問(wèn)題,這篇文章先寫(xiě)到這里,后續(xù)再分享其他的sql優(yōu)化經(jīng)歷。

三、海量數(shù)據(jù)分頁(yè)查找時(shí)如何使用主鍵索引進(jìn)行優(yōu)化

mysql百萬(wàn)級(jí)分頁(yè)優(yōu)化

  普通分頁(yè)

  數(shù)據(jù)分頁(yè)在網(wǎng)頁(yè)中十分多見(jiàn),分頁(yè)一般都是limit start,offset,然后根據(jù)頁(yè)碼page計(jì)算start

 select * from user limit **1**,**20**

   這種分頁(yè)在幾十萬(wàn)的時(shí)候分頁(yè)效率就會(huì)比較低了,MySQL需要從頭開(kāi)始一直往后計(jì)算,這樣大大影響效率

SELECT * from user limit **100001**,**20**; //time **0**.151s explain SELECT * from user limit **100001**,**20**;

  我們可以用explain分析下語(yǔ)句,沒(méi)有用到任何索引,MySQL執(zhí)行的行數(shù)是16W+,于是我們可以想用到索引去實(shí)現(xiàn)分頁(yè)

   重新學(xué)習(xí)MySQL數(shù)據(jù)庫(kù)12:從實(shí)踐sql語(yǔ)句優(yōu)化開(kāi)始

   優(yōu)化分頁(yè)

   使用主鍵索引來(lái)優(yōu)化數(shù)據(jù)分頁(yè)

 select * from user where id>(select id from user where id>=**100000** limit **1**) limit **20**; //time **0**.003s

  使用explain分析語(yǔ)句,MySQL這次掃描的行數(shù)是8W+,時(shí)間也大大縮短。

 explain select * from user where id>(select id from user where id>=**100000** limit **1**) limit **20**;
 ![](https://oscimg.oschina.net/oscnet/05fffbffc5e3ef9add4719846ad53f25099.jpg)

  總結(jié)

  在數(shù)據(jù)量比較大的時(shí)候,我們盡量去利用索引來(lái)優(yōu)化語(yǔ)句。上面的優(yōu)化方法如果id不是主鍵索引,查詢(xún)效率比第一種還要低點(diǎn)。我們可以先使用explain來(lái)分析語(yǔ)句,查看語(yǔ)句的執(zhí)行順序和執(zhí)行性能。

轉(zhuǎn)載于: https://my.oschina.net/alicoder/blog/3097141

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI