溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

寫優(yōu)雅SQL原生語句的方法

發(fā)布時(shí)間:2020-08-25 13:44:02 來源:億速云 閱讀:172 作者:小新 欄目:MySQL數(shù)據(jù)庫

寫優(yōu)雅SQL原生語句的方法?這個(gè)問題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見到的。希望通過這個(gè)問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容,讓我們一起來看看吧!

前言:

上一篇講Mysql基本架構(gòu)時(shí),以"sql查詢語句在MySql架構(gòu)中具體是怎么執(zhí)行的" 進(jìn)行了全面的講解。知道了sql查詢語句在MySql架構(gòu)中的具體執(zhí)行流程,但是為了能夠更好更快的寫出sql語句,我覺得非常有必要知道sql語句中各子句的執(zhí)行順序??催^上一篇文章的小伙伴應(yīng)該都知道,sql語句最后各子句的執(zhí)行應(yīng)該是在執(zhí)行器中完成的,存儲(chǔ)引擎對(duì)執(zhí)行器提供的數(shù)據(jù)讀寫接口?,F(xiàn)在開始我們的學(xué)習(xí)

語句中各子句完整執(zhí)行順序概括(按照順序號(hào)執(zhí)行)

  1. from (注:這里也包括from中的子語句)

  2. join

  3. on

  4. where

  5. group by(開始使用select中的別名,后面的語句中都可以使用)

  6. avg,sum.... 等聚合函數(shù)

  7. having

  8. select

  9. distinct

  10. order by

  11. limit

每個(gè)子句執(zhí)行順序分析

所有的 查詢語句都是從from開始執(zhí)行的,在執(zhí)行過程中,每個(gè)步驟都會(huì)為下一個(gè)步驟生成一個(gè)虛擬表,這個(gè)虛擬表將作為下一個(gè)執(zhí)行步驟的輸入。

1. from

form是一次查詢語句的開端。

  • 如果是一張表,會(huì)直接操作這張表;

  • 如果這個(gè)from后面是一個(gè)子查詢,會(huì)先執(zhí)行子查詢中的內(nèi)容,子查詢的結(jié)果也就是第一個(gè)虛擬表T1。(注意:子查詢中的執(zhí)行流程也是按照本篇文章講的順序哦)。

  • 如果需要關(guān)聯(lián)表,使用join,請(qǐng)看2,3

2. join

如果from后面是多張表,join關(guān)聯(lián),會(huì)首先對(duì)前兩個(gè)表執(zhí)行一個(gè)笛卡爾乘積,這時(shí)候就會(huì)生成第一個(gè)虛擬表T1(注意:這里會(huì)選擇相對(duì)小的表作為基礎(chǔ)表);

3.  on

對(duì)虛表T1進(jìn)行ON篩選,只有那些符合的行才會(huì)被記錄在虛表T2中。(注意,這里的這里如果還有第三個(gè)表與之關(guān)聯(lián),會(huì)用T2與第三個(gè)表進(jìn)行笛卡爾乘積生產(chǎn)T3表,繼續(xù)重復(fù)3. on步驟生成T4表,不過下面的順序講解暫時(shí)不針對(duì)這里的T3和T4,只是從一個(gè)表關(guān)聯(lián)查詢T2繼續(xù)說)

4. where

對(duì)虛擬表T2進(jìn)行WHERE條件過濾。只有符合的記錄才會(huì)被插入到虛擬表T3中。

5.group by

group by 子句將中的唯一的值組合成為一組,得到虛擬表T4。如果應(yīng)用了group by,那么后面的所有步驟都只能操作T4的列或者是執(zhí)行6.聚合函數(shù)(count、sum、avg等)。(注意:原因在于分組后最終的結(jié)果集中只包含每個(gè)組中的一行。謹(jǐn)記,不然這里會(huì)出現(xiàn)很多問題,下面的代碼誤區(qū)會(huì)特別說。)

6. avg,sum.... 等聚合函數(shù)

聚合函數(shù)只是對(duì)分組的結(jié)果進(jìn)行一些處理,拿到某些想要的聚合值,例如求和,統(tǒng)計(jì)數(shù)量等,并不生成虛擬表。

7.  having

應(yīng)用having篩選器,生成T5。HAVING子句主要和GROUP BY子句配合使用,having篩選器是第一個(gè)也是為唯一一個(gè)應(yīng)用到已分組數(shù)據(jù)的篩選器。

8.  select

執(zhí)行select操作,選擇指定的列,插入到虛擬表T6中。

9.  distinct

對(duì)T6中的記錄進(jìn)行去重。移除相同的行,產(chǎn)生虛擬表T7.(注意:事實(shí)上如果應(yīng)用了group by子句那么distinct是多余的,原因同樣在于,分組的時(shí)候是將列中唯一的值分成一組,同時(shí)只為每一組返回一行記錄,那么所以的記錄都將是不相同的。 )

10. order by

應(yīng)用order by子句。按照order_by_condition排序T7,此時(shí)返回的一個(gè)游標(biāo),而不是虛擬表。sql是基于集合的理論的,集合不會(huì)預(yù)先對(duì)他的行排序,它只是成員的邏輯集合,成員的順序是無關(guān)緊要的。對(duì)表進(jìn)行排序的查詢可以返回一個(gè)對(duì)象,這個(gè)對(duì)象包含特定的物理順序的邏輯組織。這個(gè)對(duì)象就叫游標(biāo)。
oder by的幾點(diǎn)說明

  • 因?yàn)閛rder by返回值是游標(biāo),那么使用order by 子句查詢不能應(yīng)用于表表達(dá)式。

  • order by排序是很需要成本的,除非你必須要排序,否則最好不要指定order by,

  • order by的兩個(gè)參數(shù)  asc(升序排列)  desc(降序排列)

11. limit

取出指定行的記錄,產(chǎn)生虛擬表T9, 并將結(jié)果返回。

limit后面的參數(shù)可以是 一個(gè)limit m ,也可以是limit m n,表示從第m條到第n條數(shù)據(jù)。

(注意:很多開發(fā)人員喜歡使用該語句來解決分頁問題。對(duì)于小數(shù)據(jù),使用LIMIT子句沒有任何問題,當(dāng)數(shù)據(jù)量非常大的時(shí)候,使用LIMIT n, m是非常低效的。因?yàn)長IMIT的機(jī)制是每次都是從頭開始掃描,如果需要從第60萬行開始,讀取3條數(shù)據(jù),就需要先掃描定位到60萬行,然后再進(jìn)行讀取,而掃描的過程是一個(gè)非常低效的過程。所以,對(duì)于大數(shù)據(jù)處理時(shí),是非常有必要在應(yīng)用層建立一定的緩存機(jī)制)

開發(fā)某需求寫的一段sql

SELECT `userspk`.`avatar` AS `user_avatar`, 
`a`.`user_id`, 
`a`.`answer_record`, 
 MAX(`score`) AS `score`FROM (select * from pkrecord  order by score desc) as a 
INNER JOIN `userspk` AS `userspk` ON `a`.`user_id` = `userspk`.`user_id`WHERE `a`.`status` = 1 AND `a`.`user_id` != 'm_6da5d9e0-4629-11e9-b5f7-694ced396953' GROUP BY `user_id`ORDER BY `a`.`score` DESC LIMIT 9;

查詢結(jié)果:

寫優(yōu)雅SQL原生語句的方法

  • 先簡(jiǎn)要說一下我要查詢的內(nèi)容:

想要查詢pk記錄表中分?jǐn)?shù)最高的9個(gè)用戶記錄和他們的頭像。

  • 通過這段sql實(shí)際想一遍sql各字句的執(zhí)行順序

pk記錄表的數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì),每個(gè)用戶每天每個(gè)館下可能會(huì)有多條記錄,所以需要進(jìn)行分組,并且查詢結(jié)果只想拿到每個(gè)分組內(nèi)最高的那條記錄。

這段sql的一些說明:

  1. 可能有些同學(xué)會(huì)認(rèn)為子查詢沒有必要 直接查詢pk記錄表就可以,但是并不能拿到預(yù)期的結(jié)果,因?yàn)?strong>分組后的每個(gè)組結(jié)果是不進(jìn)行排序的,而且max拿到的最高分?jǐn)?shù)肯定是對(duì)應(yīng)的該分組下最高分?jǐn)?shù),但是其它記錄可能就不是最高分?jǐn)?shù)對(duì)應(yīng)的那條記錄。所以子查詢非常有必要,它能夠?qū)υ嫉臄?shù)據(jù)首先進(jìn)行排序,分?jǐn)?shù)最高的那條就是第一條對(duì)應(yīng)的第一條記錄。

看一下代碼和執(zhí)行結(jié)果與帶有子查詢的進(jìn)行比較,就能理解我上面說的一段話:

//不使用子查詢SELECT `userspk`.`avatar` AS `user_avatar`, 
`pkrecord`.`user_id`, 
`pkrecord`.`answer_record`, 
`pkrecord`.`id`, 
 MAX(`score`) AS `score`FROM pkrecordINNER JOIN `userspk` AS `userspk` ON `pkrecord`.`user_id` = `userspk`.`user_id`WHERE `pkrecord`.`status` = 1 AND `pkrecord`.`user_id` != 'm_6da5d9e0-4629-11e9-b5f7-694ced396953' GROUP BY `user_id`ORDER BY `pkrecord`.`score` DESC LIMIT 9;

查詢結(jié)果

寫優(yōu)雅SQL原生語句的方法2. 在子查詢中對(duì)數(shù)據(jù)已經(jīng)進(jìn)行排序后,外層排序方式如果和子查詢排序分?jǐn)?shù)相同,都是分?jǐn)?shù)倒序,外層的排序可以去掉,沒有必要寫兩遍。

sql語句中的別名

別名在哪些情況使用

在 SQL 語句中,可以為表名稱及字段(列)名稱指定別名

  • 表名稱指定別名

同時(shí)查詢兩張表的數(shù)據(jù)的時(shí)候: 未設(shè)置別名前:

SELECT article.title,article.content,user.username FROM article, userWHERE article.aid=1 AND article.uid=user.uid

設(shè)置別名后:

SELECT a.title,a.content,u.username FROM article AS a, user AS u where a.aid=1 and a.uid=u.uid

好處:使用表別名查詢,可以使 SQL 變得簡(jiǎn)潔而更易書寫和閱讀,尤其在 SQL 比較復(fù)雜的情況下

  • 查詢字段指定別名

查詢一張表,直接對(duì)查詢字段設(shè)置別名

SELECT username AS name,email FROM user

查詢兩張表

好處:字段別名一個(gè)明顯的效果是可以自定義查詢數(shù)據(jù)返回的字段名;當(dāng)兩張表有相同的字段需要都被查詢出,使用別名可以完美的進(jìn)行區(qū)分,避免沖突

SELECT a.title AS atitle,u.username,u.title AS utitle FROM article AS a, user AS u where a.uid=u.uid
  • 關(guān)聯(lián)查詢時(shí)候,關(guān)聯(lián)表自身的時(shí)候,一些分類表,必須使用別名。

  • 別名也可以在group         by與having的時(shí)候都可使用

  • 別名可以在order by排序的時(shí)候被使用

    查看上面一段sql

  • delete , update MySQL都可以使用別名,別名在多表(級(jí)聯(lián))刪除尤為有用

delete t1,t2 from t_a t1 , t_b t2 where t1.id = t2.id
  • 子查詢結(jié)果需要使用別名

    查看上面一段sql

別名使用注意事項(xiàng)
  • 雖然定義字段別名的 AS 關(guān)鍵字可以省略,但是在使用別名時(shí)候,建議不要省略 AS 關(guān)鍵字

書寫sql語句的注意事項(xiàng)

書寫規(guī)范上的注意
  • 字符串類型的要加單引號(hào)

  • select后面的每個(gè)字段要用逗號(hào)分隔,但是最后連著from的字段不要加逗號(hào)

  • 使用子查詢創(chuàng)建臨時(shí)表的時(shí)候要使用別名,否則會(huì)報(bào)錯(cuò)。

為了增強(qiáng)性能的注意
  • 不要使用“select * from ……”返回所有列,只檢索需要的列,可避免后續(xù)因表結(jié)構(gòu)變化導(dǎo)致的不必要的程序修改,還可降低額外消耗的資源

  • 不要檢索已知的列

select  user_id,name from User where user_id = ‘10000050’
  • 使用可參數(shù)化的搜索條件,如=, >, >=, <, <=, between, in, is null以及l(fā)ike ‘%’;盡量不要使用非參數(shù)化的負(fù)向查詢,這將導(dǎo)致無法使用索引,如<>, !=, !>, !<, not in, not like, not exists, not between, is not null, like ‘%’

  • 當(dāng)需要驗(yàn)證是否有符合條件的記錄時(shí),使用exists,不要使用count(*),前者在第一個(gè)匹配記錄處返回,后者需要遍歷所有匹配記錄

  • Where子句中列的順序與需使用的索引順序保持一致,不是所有數(shù)據(jù)庫的優(yōu)化器都能對(duì)此順序進(jìn)行優(yōu)化,保持良好編程習(xí)慣(索引相關(guān))

  • 不要在where子句中對(duì)字段進(jìn)行運(yùn)算或函數(shù)(索引相關(guān))

  1. 如where  amount / 2 > 100,即使amount字段有索引,也無法使用,改成where amount > 100 * 2就可使用amount列上的索引

  2. 如where substring( Lastname, 1, 1) = ‘F’就無法使用Lastname列上的索引,而where Lastname like ‘F%’或者where Lastname >= ‘F’ and Lastname < ‘G’就可以

  • 在有min、max、distinct、order by、group by操作的列上建索引,避免額外的排序開銷(索引相關(guān))

  • 小心使用or操作,and操作中任何一個(gè)子句可使用索引都會(huì)提高查詢性能,但是or條件中任何一個(gè)不能使用索引,都將導(dǎo)致查詢性能下降,如where member_no = 1 or provider_no = 1,在member_no或provider_no任何一個(gè)字段上沒有索引,都將導(dǎo)致表掃描或聚簇索引掃描(索引相關(guān))

  • Between一般比in/or高效得多,如果能在between和in/or條件中選擇,那么始終選擇between條件,并用>=和<=條件組合替代between子句,因?yàn)椴皇撬袛?shù)據(jù)庫的優(yōu)化器都能把between子句改寫為>=和<=條件組合,如果不能改寫將導(dǎo)致無法使用索引(索引相關(guān))

  • 調(diào)整join操作順序以使性能最優(yōu),join操作是自頂向下的,盡量把結(jié)果集小的兩個(gè)表關(guān)聯(lián)放在前面,可提高性能。(join相關(guān)) 注意:索引和關(guān)聯(lián)我會(huì)單獨(dú)拿出來兩篇文章進(jìn)行詳細(xì)講解,在這個(gè)注意事項(xiàng)中只是簡(jiǎn)單提一下。

感謝各位的閱讀!看完上述內(nèi)容,你們對(duì)寫優(yōu)雅SQL原生語句的方法大概了解了嗎?希望文章內(nèi)容對(duì)大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

sql
AI