溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

總結(jié)數(shù)據(jù)庫建表/SQL/索引規(guī)范

發(fā)布時(shí)間:2021-10-22 15:43:31 來源:億速云 閱讀:178 作者:iii 欄目:數(shù)據(jù)庫

這篇文章主要介紹“總結(jié)數(shù)據(jù)庫建表/SQL/索引規(guī)范”,在日常操作中,相信很多人在總結(jié)數(shù)據(jù)庫建表/SQL/索引規(guī)范問題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”總結(jié)數(shù)據(jù)庫建表/SQL/索引規(guī)范”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!

一、建表規(guī)約

【強(qiáng)制】(1) 存儲(chǔ)引擎必須使用InnoDB

解讀:InnoDB支持事物、行級(jí)鎖、并發(fā)性能更好,CPU及內(nèi)存緩存頁優(yōu)化使得資源利用率更高。

【強(qiáng)制】(2)每張表必須設(shè)置一個(gè)主鍵ID,且這個(gè)主鍵ID使用自增主鍵(在滿足需要的情況下盡量短),除非在分庫分表環(huán)境下

解讀:由于InnoDB組織數(shù)據(jù)的方式?jīng)Q定了需要有一個(gè)主鍵,而且若是這個(gè)主鍵ID是單調(diào)遞增的可以有效提高插入的性能,避免過多的頁分裂、減少表碎片提高空間的使用率。 而在分庫分表環(huán)境下,則需要統(tǒng)一來分配各個(gè)表中的主鍵值,從而避免整個(gè)邏輯表中主鍵重復(fù)。

【強(qiáng)制】(3)必須使用utf8mb4字符集

解讀:在Mysql中的UTF-8并非“真正的UTF-8”,而utf8mb4”才是真正的“UTF-8”。

【強(qiáng)制】(4) 數(shù)據(jù)庫表、表字段必須加入中文注釋

解讀:大家都別懶。

【強(qiáng)制】(5) 庫名、表名、字段名均小寫,下劃線風(fēng)格,不超過32個(gè)字符,必須見名知意,禁止拼音英文混用

解讀:約定。

【強(qiáng)制】(6)單表列數(shù)目必須小于30,若超過則應(yīng)該考慮將表拆分

解讀:?jiǎn)伪砹袛?shù)太多使得Mysql服務(wù)器處理InnoDB返回?cái)?shù)據(jù)之間的映射成本太高。

【強(qiáng)制】(7)禁止使用外鍵,如果有外鍵完整性約束,需要應(yīng)用程序控制

解讀:外鍵會(huì)導(dǎo)致表與表之間耦合,UPDATE與DELETE操作都會(huì)涉及相關(guān)聯(lián)的表,十分影響SQL的性能,甚至?xí)斐伤梨i。

【強(qiáng)制】(8)必須把字段定義為NOT NULL并且提供默認(rèn)值

解讀:

  •  NULL的列使索引/索引統(tǒng)計(jì)/值比較都更加復(fù)雜,對(duì)MySQL來說更難優(yōu)化;

  •  NULL這種類型Msql內(nèi)部需要進(jìn)行特殊處理,增加數(shù)據(jù)庫處理記錄的復(fù)雜性;同等條件下,表中有較多空字段的時(shí)候,數(shù)據(jù)庫的處理性能會(huì)降低很多;

  •  NULL值需要更多的存儲(chǔ)空,無論是表還是索引中每行中的NULL的列都需要額外的空間來標(biāo)識(shí)。

【強(qiáng)制】(9)禁用保留字,如DESC、RANGE、MARCH等,請(qǐng)參考Mysql官方保留字

【強(qiáng)制】(10)如果存儲(chǔ)的字符串長(zhǎng)度幾乎相等,使用CHAR定長(zhǎng)字符串類型。

解讀:能夠減少空間碎片,節(jié)省存儲(chǔ)空間。

【建議】(11)在一些場(chǎng)景下,考慮使用TIMESTAMP代替DATETIME

解讀:

  •  這兩種類型的都能表達(dá)"yyyy-MM-dd HH:mm:ss"格式的時(shí)間,TIMESTAMP只需要占用4個(gè)字節(jié)的長(zhǎng)度,可以存儲(chǔ)的范圍為(1970-2038)年,在各個(gè)時(shí)區(qū),所展示的時(shí)間是不一樣的;

  •  而DATETIME類型占用8個(gè)字節(jié),對(duì)時(shí)區(qū)不敏感,可以存儲(chǔ)的范圍為(1001-9999)年。

* 【建議】(12)當(dāng)心自動(dòng)生成的Schema,建議所有的Schema手動(dòng)編寫

解讀:對(duì)于一些數(shù)據(jù)庫客戶端不要太過信任。

二、SQL規(guī)約

【建議】 (1) 為了充分利用緩存,不允許使用自定義函數(shù)、存儲(chǔ)函數(shù)、用戶變量

解讀:如果查詢中包含任何用戶自定義函數(shù)、存儲(chǔ)函數(shù)、用戶變量、臨時(shí)表、Mysql庫中的系統(tǒng)表,其查詢結(jié)果都不會(huì)被緩存。比如函數(shù)NOW()或者CURRENT_DATE()會(huì)因?yàn)椴煌牟樵儠r(shí)間,返回不同的查詢結(jié)果。

【強(qiáng)制】(2)在查詢中指定所需的列,而不是直接使用“ *”返回所有的列

解讀:

  •  讀取不需要的列會(huì)增加CPU、IO、NET消耗;

  •  不能有效的利用覆蓋索引。

【強(qiáng)制】(3)不允許使用屬性隱式轉(zhuǎn)換

解讀:假設(shè)我們?cè)谑謾C(jī)號(hào)列上添加了索引,然后執(zhí)行下面的SQL會(huì)發(fā)生什么?explain SELECT user_name FROM parent WHERE phone=13812345678; 很明顯就是索引不生效,會(huì)全表掃描。

【建議】(4)在WHERE條件的屬性上使用函數(shù)或者表達(dá)式

解讀:Mysql無法自動(dòng)解析這種表達(dá)式,無法使用到索引。

【強(qiáng)制】(5)禁止使用外鍵與級(jí)聯(lián),一切外鍵概念必須在應(yīng)用層解決

解讀:外鍵與級(jí)聯(lián)更新適用于單機(jī)低并發(fā),不適合分布式、高并發(fā)集群;級(jí)聯(lián)更新是強(qiáng)阻塞,存在數(shù)據(jù)庫更新風(fēng)暴的風(fēng)險(xiǎn);外鍵影響數(shù)據(jù)庫的插入速度。

【建議】(6)應(yīng)盡量避免在WHERE子句中使用or作為連接條件

解讀:根據(jù)情況可以選擇使用UNION ALL來代替OR。

【強(qiáng)制】(7)不允許使用%開頭的模糊查詢

解讀:根據(jù)索引的最左前綴原理,%開頭的模糊查詢無法使用索引,可以使用ES來做檢索。

三、索引規(guī)約

【建議】(1)避免在更新比較頻繁、區(qū)分度不高的列上單獨(dú)建立索引

解讀:區(qū)分度不高的列單獨(dú)創(chuàng)建索引的優(yōu)化效果很小,但是較為頻繁的更新則會(huì)讓索引的維護(hù)成本更高。

【強(qiáng)制】(2) JOIN的表不允許超過五個(gè)。需要JOIN的字段,數(shù)據(jù)類型必須絕對(duì)一致; 多表關(guān)聯(lián)查詢時(shí),保證被關(guān)聯(lián)的字段需要有索引

解讀:太多表的JOIN會(huì)讓Mysql的優(yōu)化器更難權(quán)衡出一個(gè)“最佳”的執(zhí)行計(jì)劃(可能性為表數(shù)量的階乘),同時(shí)要注意關(guān)聯(lián)字段的類型、長(zhǎng)度、字符編碼等等是否一致。

【強(qiáng)制】(3)在一個(gè)聯(lián)合索引中,若第一列索引區(qū)分度等于1,那么則不需要建立聯(lián)合索引

解讀:索引通過第一列就能夠完全定位的數(shù)據(jù),所以聯(lián)合索引的后邊部分是不需要的。

【強(qiáng)制】(4)建立聯(lián)合索引時(shí),必須將區(qū)分度更高的字段放在左邊

解讀:區(qū)分度更高的列放在左邊,能夠在一開始就有效的過濾掉無用數(shù)據(jù)。提高索引的效率,相應(yīng)我們?cè)贛apper中編寫SQL的WHERE條件中有多個(gè)條件時(shí),需要先看看當(dāng)前表是否有現(xiàn)成的聯(lián)合索引直接使用,注意各個(gè)條件的順序盡量和索引的順序一致。

【建議】(5)利用覆蓋索引來進(jìn)行查詢操作,避免回表

解讀:覆蓋查詢即是查詢只需要通過索引即可拿到所需DATA,而不再需要再次回表查詢,所以效率相對(duì)很高。我們?cè)谑褂肊XPLAIN的結(jié)果,extra列會(huì)出現(xiàn):"using index"。這里也要強(qiáng)調(diào)一下不要使用“SELECT * ”,否則幾乎不可能使用到覆蓋索引。

【建議】(6)在較長(zhǎng)VARCHAR字段,例如VARCHAR(100)上建立索引時(shí),應(yīng)指定索引長(zhǎng)度,沒必要對(duì)全字段建立索引,根據(jù)實(shí)際文本區(qū)分度決定索引長(zhǎng)度即可

解讀:索引的長(zhǎng)度與區(qū)分度是一對(duì)矛盾體,一般對(duì)字符串類型數(shù)據(jù),若長(zhǎng)度為20的索引,區(qū)分度會(huì)高達(dá)90%以上,則可以考慮創(chuàng)建長(zhǎng)度例為20的索引,而非全字段索引。例如可以使用SELECT COUNT(DISTINCT LEFT(lesson_code, 20)) / COUNT(*) FROM lesson;來確定lesson_code字段字符長(zhǎng)度為20時(shí)文本區(qū)分度。

【建議】(7)如果有ORDER BY的場(chǎng)景,請(qǐng)注意利用索引的有序性。ORDER BY最后的字段是聯(lián)合索引的一部分,并且放在索引組合順序的最后,避免出現(xiàn)file_sort的情況,影響查詢性能。

解讀:

  •  假設(shè)有查詢條件為WHERE a=? and b=? ORDER BY c;存在索引:a_b_c,則此時(shí)可以利用索引排序;

  •  反例:在查詢條件中包含了范圍查詢,那么索引有序性無法利用,如:WHERE a>10 ORDER BY b; 索引a_b無法排序。

【建議】(8)在where中索引的列不能某個(gè)表達(dá)式的一部分,也不能是函數(shù)的參數(shù)

解讀:即是某列上已經(jīng)添加了索引,但是若此列成為表達(dá)式的一部分、或者是函數(shù)的參數(shù),Mysql無法將此列單獨(dú)解析出來,索引也不會(huì)生效。

【建議】 (9)我們?cè)趙here條件中使用范圍查詢時(shí),索引最多用于一個(gè)范圍條件,超過一個(gè)則后邊的不走索引

解讀:Mysql能夠使用多個(gè)范圍條件里邊的最左邊的第一個(gè)范圍查詢,但是后邊的范圍查詢則無法使用。

【建議】 (10)在多個(gè)表進(jìn)行外連接時(shí),表之間的關(guān)聯(lián)字段類型必須完全一致

解讀:當(dāng)兩個(gè)表進(jìn)行Join時(shí),字段類型若沒有完全一致,則加索引也不會(huì)生效,這里的完全一致包括但不限于字段類型、字段長(zhǎng)度、字符集、collection等等。

到此,關(guān)于“總結(jié)數(shù)據(jù)庫建表/SQL/索引規(guī)范”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI