寫優(yōu)雅SQL原生語句的方法

發(fā)布時(shí)間：2020-08-25 13:44:02 來源：億速云閱讀：172 作者：小新欄目：MySQL數(shù)據(jù)庫

寫優(yōu)雅SQL原生語句的方法？這個(gè)問題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見到的。希望通過這個(gè)問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容，讓我們一起來看看吧！

前言：

上一篇講Mysql基本架構(gòu)時(shí)，以"sql查詢語句在MySql架構(gòu)中具體是怎么執(zhí)行的" 進(jìn)行了全面的講解。知道了sql查詢語句在MySql架構(gòu)中的具體執(zhí)行流程，但是為了能夠更好更快的寫出sql語句，我覺得非常有必要知道sql語句中各子句的執(zhí)行順序?？催^上一篇文章的小伙伴應(yīng)該都知道，sql語句最后各子句的執(zhí)行應(yīng)該是在執(zhí)行器中完成的，存儲(chǔ)引擎對(duì)執(zhí)行器提供的數(shù)據(jù)讀寫接口?，F(xiàn)在開始我們的學(xué)習(xí)

語句中各子句完整執(zhí)行順序概括（按照順序號(hào)執(zhí)行）

from (注:這里也包括from中的子語句)
join
on
where
group by(開始使用select中的別名，后面的語句中都可以使用)
avg,sum.... 等聚合函數(shù)
having
select
distinct
order by
limit

每個(gè)子句執(zhí)行順序分析

所有的查詢語句都是從from開始執(zhí)行的，在執(zhí)行過程中，每個(gè)步驟都會(huì)為下一個(gè)步驟生成一個(gè)虛擬表，這個(gè)虛擬表將作為下一個(gè)執(zhí)行步驟的輸入。

1. from

form是一次查詢語句的開端。

如果是一張表，會(huì)直接操作這張表；
如果這個(gè)from后面是一個(gè)子查詢，會(huì)先執(zhí)行子查詢中的內(nèi)容，子查詢的結(jié)果也就是第一個(gè)虛擬表T1。（注意：子查詢中的執(zhí)行流程也是按照本篇文章講的順序哦）。
如果需要關(guān)聯(lián)表，使用join，請(qǐng)看2，3

2. join

如果from后面是多張表，join關(guān)聯(lián)，會(huì)首先對(duì)前兩個(gè)表執(zhí)行一個(gè)笛卡爾乘積，這時(shí)候就會(huì)生成第一個(gè)虛擬表T1（注意：這里會(huì)選擇相對(duì)小的表作為基礎(chǔ)表）；

3. on

對(duì)虛表T1進(jìn)行ON篩選，只有那些符合的行才會(huì)被記錄在虛表T2中。（注意，這里的這里如果還有第三個(gè)表與之關(guān)聯(lián)，會(huì)用T2與第三個(gè)表進(jìn)行笛卡爾乘積生產(chǎn)T3表，繼續(xù)重復(fù)3. on步驟生成T4表，不過下面的順序講解暫時(shí)不針對(duì)這里的T3和T4，只是從一個(gè)表關(guān)聯(lián)查詢T2繼續(xù)說）

4. where

對(duì)虛擬表T2進(jìn)行WHERE條件過濾。只有符合的記錄才會(huì)被插入到虛擬表T3中。

5.group by

group by 子句將中的唯一的值組合成為一組，得到虛擬表T4。如果應(yīng)用了group by，那么后面的所有步驟都只能操作T4的列或者是執(zhí)行6.聚合函數(shù)（count、sum、avg等）。（注意：原因在于分組后最終的結(jié)果集中只包含每個(gè)組中的一行。謹(jǐn)記，不然這里會(huì)出現(xiàn)很多問題，下面的代碼誤區(qū)會(huì)特別說。）

6. avg,sum.... 等聚合函數(shù)

聚合函數(shù)只是對(duì)分組的結(jié)果進(jìn)行一些處理，拿到某些想要的聚合值，例如求和，統(tǒng)計(jì)數(shù)量等，并不生成虛擬表。

7. having

應(yīng)用having篩選器，生成T5。HAVING子句主要和GROUP BY子句配合使用，having篩選器是第一個(gè)也是為唯一一個(gè)應(yīng)用到已分組數(shù)據(jù)的篩選器。

8. select

執(zhí)行select操作，選擇指定的列，插入到虛擬表T6中。

9. distinct

對(duì)T6中的記錄進(jìn)行去重。移除相同的行，產(chǎn)生虛擬表T7.（注意：事實(shí)上如果應(yīng)用了group by子句那么distinct是多余的，原因同樣在于，分組的時(shí)候是將列中唯一的值分成一組，同時(shí)只為每一組返回一行記錄，那么所以的記錄都將是不相同的。）

10. order by

應(yīng)用order by子句。按照order_by_condition排序T7，此時(shí)返回的一個(gè)游標(biāo)，而不是虛擬表。sql是基于集合的理論的，集合不會(huì)預(yù)先對(duì)他的行排序，它只是成員的邏輯集合，成員的順序是無關(guān)緊要的。對(duì)表進(jìn)行排序的查詢可以返回一個(gè)對(duì)象，這個(gè)對(duì)象包含特定的物理順序的邏輯組織。這個(gè)對(duì)象就叫游標(biāo)。
oder by的幾點(diǎn)說明

因?yàn)閛rder by返回值是游標(biāo)，那么使用order by 子句查詢不能應(yīng)用于表表達(dá)式。
order by排序是很需要成本的，除非你必須要排序，否則最好不要指定order by，
order by的兩個(gè)參數(shù) asc（升序排列） desc（降序排列）

11. limit

取出指定行的記錄，產(chǎn)生虛擬表T9, 并將結(jié)果返回。

limit后面的參數(shù)可以是一個(gè)limit m ，也可以是limit m n，表示從第m條到第n條數(shù)據(jù)。

（注意：很多開發(fā)人員喜歡使用該語句來解決分頁問題。對(duì)于小數(shù)據(jù)，使用LIMIT子句沒有任何問題，當(dāng)數(shù)據(jù)量非常大的時(shí)候，使用LIMIT n, m是非常低效的。因?yàn)長IMIT的機(jī)制是每次都是從頭開始掃描，如果需要從第60萬行開始，讀取3條數(shù)據(jù)，就需要先掃描定位到60萬行，然后再進(jìn)行讀取，而掃描的過程是一個(gè)非常低效的過程。所以，對(duì)于大數(shù)據(jù)處理時(shí)，是非常有必要在應(yīng)用層建立一定的緩存機(jī)制）

開發(fā)某需求寫的一段sql

SELECT `userspk`.`avatar` AS `user_avatar`, 
`a`.`user_id`, 
`a`.`answer_record`, 
 MAX(`score`) AS `score`FROM (select * from pkrecord  order by score desc) as a 
INNER JOIN `userspk` AS `userspk` ON `a`.`user_id` = `userspk`.`user_id`WHERE `a`.`status` = 1 AND `a`.`user_id` != 'm_6da5d9e0-4629-11e9-b5f7-694ced396953' GROUP BY `user_id`ORDER BY `a`.`score` DESC LIMIT 9;

查詢結(jié)果：

寫優(yōu)雅SQL原生語句的方法

先簡(jiǎn)要說一下我要查詢的內(nèi)容：

想要查詢pk記錄表中分?jǐn)?shù)最高的9個(gè)用戶記錄和他們的頭像。

通過這段sql實(shí)際想一遍sql各字句的執(zhí)行順序

pk記錄表的數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)，每個(gè)用戶每天每個(gè)館下可能會(huì)有多條記錄，所以需要進(jìn)行分組，并且查詢結(jié)果只想拿到每個(gè)分組內(nèi)最高的那條記錄。

這段sql的一些說明：

可能有些同學(xué)會(huì)認(rèn)為子查詢沒有必要直接查詢pk記錄表就可以，但是并不能拿到預(yù)期的結(jié)果，因?yàn)?strong>分組后的每個(gè)組結(jié)果是不進(jìn)行排序的，而且max拿到的最高分?jǐn)?shù)肯定是對(duì)應(yīng)的該分組下最高分?jǐn)?shù)，但是其它記錄可能就不是最高分?jǐn)?shù)對(duì)應(yīng)的那條記錄。所以子查詢非常有必要，它能夠?qū)υ嫉臄?shù)據(jù)首先進(jìn)行排序，分?jǐn)?shù)最高的那條就是第一條對(duì)應(yīng)的第一條記錄。

看一下代碼和執(zhí)行結(jié)果與帶有子查詢的進(jìn)行比較，就能理解我上面說的一段話：

//不使用子查詢SELECT `userspk`.`avatar` AS `user_avatar`, 
`pkrecord`.`user_id`, 
`pkrecord`.`answer_record`, 
`pkrecord`.`id`, 
 MAX(`score`) AS `score`FROM pkrecordINNER JOIN `userspk` AS `userspk` ON `pkrecord`.`user_id` = `userspk`.`user_id`WHERE `pkrecord`.`status` = 1 AND `pkrecord`.`user_id` != 'm_6da5d9e0-4629-11e9-b5f7-694ced396953' GROUP BY `user_id`ORDER BY `pkrecord`.`score` DESC LIMIT 9;

查詢結(jié)果

寫優(yōu)雅SQL原生語句的方法 2. 在子查詢中對(duì)數(shù)據(jù)已經(jīng)進(jìn)行排序后，外層排序方式如果和子查詢排序分?jǐn)?shù)相同，都是分?jǐn)?shù)倒序，外層的排序可以去掉，沒有必要寫兩遍。

sql語句中的別名

別名在哪些情況使用

在 SQL 語句中，可以為表名稱及字段（列）名稱指定別名

表名稱指定別名

同時(shí)查詢兩張表的數(shù)據(jù)的時(shí)候：未設(shè)置別名前：

SELECT article.title,article.content,user.username FROM article, userWHERE article.aid=1 AND article.uid=user.uid

設(shè)置別名后：

SELECT a.title,a.content,u.username FROM article AS a, user AS u where a.aid=1 and a.uid=u.uid

好處：使用表別名查詢，可以使 SQL 變得簡(jiǎn)潔而更易書寫和閱讀，尤其在 SQL 比較復(fù)雜的情況下

查詢字段指定別名

查詢一張表，直接對(duì)查詢字段設(shè)置別名

SELECT username AS name,email FROM user

查詢兩張表

好處：字段別名一個(gè)明顯的效果是可以自定義查詢數(shù)據(jù)返回的字段名；當(dāng)兩張表有相同的字段需要都被查詢出，使用別名可以完美的進(jìn)行區(qū)分，避免沖突

SELECT a.title AS atitle,u.username,u.title AS utitle FROM article AS a, user AS u where a.uid=u.uid

關(guān)聯(lián)查詢時(shí)候，關(guān)聯(lián)表自身的時(shí)候，一些分類表，必須使用別名。
別名也可以在group by與having的時(shí)候都可使用
別名可以在order by排序的時(shí)候被使用
查看上面一段sql
delete ， update MySQL都可以使用別名，別名在多表（級(jí)聯(lián)）刪除尤為有用

delete t1,t2 from t_a t1 , t_b t2 where t1.id = t2.id

子查詢結(jié)果需要使用別名
查看上面一段sql

別名使用注意事項(xiàng)

雖然定義字段別名的 AS 關(guān)鍵字可以省略，但是在使用別名時(shí)候，建議不要省略 AS 關(guān)鍵字

書寫sql語句的注意事項(xiàng)

書寫規(guī)范上的注意

字符串類型的要加單引號(hào)
select后面的每個(gè)字段要用逗號(hào)分隔，但是最后連著from的字段不要加逗號(hào)
使用子查詢創(chuàng)建臨時(shí)表的時(shí)候要使用別名，否則會(huì)報(bào)錯(cuò)。

為了增強(qiáng)性能的注意

不要使用“select * from ……”返回所有列，只檢索需要的列，可避免后續(xù)因表結(jié)構(gòu)變化導(dǎo)致的不必要的程序修改，還可降低額外消耗的資源
不要檢索已知的列

select  user_id,name from User where user_id = ‘10000050’

使用可參數(shù)化的搜索條件，如=, >, >=, <, <=, between, in, is null以及l(fā)ike ‘%’；盡量不要使用非參數(shù)化的負(fù)向查詢，這將導(dǎo)致無法使用索引，如<>, !=, !>, !<, not in, not like, not exists, not between, is not null, like ‘%’
當(dāng)需要驗(yàn)證是否有符合條件的記錄時(shí)，使用exists，不要使用count(*)，前者在第一個(gè)匹配記錄處返回，后者需要遍歷所有匹配記錄
Where子句中列的順序與需使用的索引順序保持一致，不是所有數(shù)據(jù)庫的優(yōu)化器都能對(duì)此順序進(jìn)行優(yōu)化，保持良好編程習(xí)慣（索引相關(guān)）
不要在where子句中對(duì)字段進(jìn)行運(yùn)算或函數(shù)（索引相關(guān)）

如where amount / 2 > 100，即使amount字段有索引，也無法使用，改成where amount > 100 * 2就可使用amount列上的索引
如where substring( Lastname, 1, 1) = ‘F’就無法使用Lastname列上的索引，而where Lastname like ‘F%’或者where Lastname >= ‘F’ and Lastname < ‘G’就可以

在有min、max、distinct、order by、group by操作的列上建索引，避免額外的排序開銷（索引相關(guān)）
小心使用or操作，and操作中任何一個(gè)子句可使用索引都會(huì)提高查詢性能，但是or條件中任何一個(gè)不能使用索引，都將導(dǎo)致查詢性能下降，如where member_no = 1 or provider_no = 1，在member_no或provider_no任何一個(gè)字段上沒有索引，都將導(dǎo)致表掃描或聚簇索引掃描（索引相關(guān)）
Between一般比in/or高效得多，如果能在between和in/or條件中選擇，那么始終選擇between條件，并用>=和<=條件組合替代between子句，因?yàn)椴皇撬袛?shù)據(jù)庫的優(yōu)化器都能把between子句改寫為>=和<=條件組合，如果不能改寫將導(dǎo)致無法使用索引（索引相關(guān)）
調(diào)整join操作順序以使性能最優(yōu)，join操作是自頂向下的，盡量把結(jié)果集小的兩個(gè)表關(guān)聯(lián)放在前面，可提高性能。（join相關(guān)）注意：索引和關(guān)聯(lián)我會(huì)單獨(dú)拿出來兩篇文章進(jìn)行詳細(xì)講解，在這個(gè)注意事項(xiàng)中只是簡(jiǎn)單提一下。

感謝各位的閱讀！看完上述內(nèi)容，你們對(duì)寫優(yōu)雅SQL原生語句的方法大概了解了嗎？希望文章內(nèi)容對(duì)大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

寫優(yōu)雅SQL原生語句的方法

前言：

語句中各子句完整執(zhí)行順序概括（按照順序號(hào)執(zhí)行）

每個(gè)子句執(zhí)行順序分析

1. from

2. join

3. on

4. where

5.group by

6. avg,sum.... 等聚合函數(shù)

7. having

8. select

9. distinct

10. order by

11. limit

開發(fā)某需求寫的一段sql

sql語句中的別名

別名在哪些情況使用

別名使用注意事項(xiàng)

書寫sql語句的注意事項(xiàng)

書寫規(guī)范上的注意

為了增強(qiáng)性能的注意

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽