溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

怎么在一個(gè)千萬級(jí)的數(shù)據(jù)庫查詢中提高查詢的效率

發(fā)布時(shí)間:2021-05-24 10:42:25 來源:億速云 閱讀:183 作者:小新 欄目:數(shù)據(jù)庫

小編給大家分享一下怎么在一個(gè)千萬級(jí)的數(shù)據(jù)庫查詢中提高查詢的效率,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

在實(shí)際項(xiàng)目中,當(dāng)數(shù)據(jù)庫的數(shù)據(jù)達(dá)到千萬級(jí)別時(shí)候,普通查詢效率直線下降,而且當(dāng)使用的where條件較多,其查詢效率是讓人無法容忍的。假如一個(gè)taobao訂單查詢?cè)斍橐獛资?,可想而知的用戶體驗(yàn)是多差。

下面是一些優(yōu)化方法:

一、數(shù)據(jù)庫設(shè)計(jì)方面

1、對(duì)查詢進(jìn)行優(yōu)化,應(yīng)盡量避免全表掃描,首先應(yīng)考慮在 where order by 涉及的列上建立索引;

2、應(yīng)盡量避免在 where 子句中對(duì)字段進(jìn)行 null 值判斷,否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描,如: select id from t where num is null 可以在num上設(shè)置默認(rèn)值0,確保表中num列沒有null值,然后這樣查詢: select id from t where num = 0;

3、并不是所有索引對(duì)查詢都有效,SQL是根據(jù)表中數(shù)據(jù)來進(jìn)行查詢優(yōu)化的,當(dāng)索引列有大量數(shù)據(jù)重復(fù)時(shí),查詢可能不會(huì)去利用索引,如一表中有字段sex,male、female幾乎各一半,那么即使在sex上建了索引也對(duì)查詢效率起不了作用;

4、索引并不是越多越好,索引固然可以提高相應(yīng)的 select 的效率,但同時(shí)也降低了 insert update 的效率,因?yàn)?insert update 時(shí)有可能會(huì)重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個(gè)表的索引數(shù)最好不要超過6個(gè),若太多則應(yīng)考慮一些不常使用到的列上建的索引是否有必要;

5、應(yīng)盡可能的避免更新索引數(shù)據(jù)列,因?yàn)樗饕龜?shù)據(jù)列的順序就是表記錄的物理存儲(chǔ)順序,一旦該列值改變將導(dǎo)致整個(gè)表記錄的順序的調(diào)整,會(huì)耗費(fèi)相當(dāng)大的資源。若應(yīng)用系統(tǒng)需要頻繁更新索引數(shù)據(jù)列,那么需要考慮是否應(yīng)將該索引建為索引;

6、盡量使用數(shù)字型字段,若只含數(shù)值信息的字段盡量不要設(shè)計(jì)為字符型,這會(huì)降低查詢和連接的性能,并會(huì)增加存儲(chǔ)開銷。這是因?yàn)橐嬖谔幚聿樵兒瓦B接時(shí)會(huì)逐個(gè)比較字符串中每一個(gè)字符,而對(duì)于數(shù)字型而言只需要比較一次就夠了;

7、盡可能的使用 varchar/nvarchar 代替 char/nchar ,因?yàn)槭紫茸冮L字段存儲(chǔ)空間小,可以節(jié)省存儲(chǔ)空間,其次對(duì)于查詢來說,在一個(gè)相對(duì)較小的字段內(nèi)搜索效率顯然要高些;

8、盡量使用表變量來代替臨時(shí)表。如果表變量包含大量數(shù)據(jù),請(qǐng)注意索引非常有限(只有主鍵索引);

9、避免頻繁創(chuàng)建和刪除臨時(shí)表,以減少系統(tǒng)表資源的消耗;

10、臨時(shí)表并不是不可使用,適當(dāng)?shù)厥褂盟鼈兛梢允鼓承├谈行?,例如,?dāng)需要重復(fù)引用大型表或常用表中的某個(gè)數(shù)據(jù)集時(shí)。但是,對(duì)于一次性事件,最好使用導(dǎo)出表;

11、在新建臨時(shí)表時(shí),如果一次性插入數(shù)據(jù)量很大,那么可以使用 select into 代替 create table,避免造成大量 log ,以提高速度;如果數(shù)據(jù)量不大,為了緩和系統(tǒng)表的資源,應(yīng)先create table,然后insert;

12、如果使用到了臨時(shí)表,在存儲(chǔ)過程的最后務(wù)必將所有的臨時(shí)表顯式刪除,先 truncate table ,然后 drop table ,這樣可以避免系統(tǒng)表的較長時(shí)間鎖定。

二、SQL語句方面

1、應(yīng)盡量避免在 where 子句中使用!=<>操作符,否則將引擎放棄使用索引而進(jìn)行全表掃描;

2、應(yīng)盡量避免在 where 子句中使用 or 來連接條件,否則將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描,如: select id from t where num=10 or num=20 可以這樣查詢: select id from t where num=10 union all select id from t where num=20;

3、in not in 也要慎用,否則會(huì)導(dǎo)致全表掃描,如: select id from t where num in(1,2,3) 對(duì)于連續(xù)的數(shù)值,能用 between 就不要用 in 了: select id from t where num between 1 and 3;

4、下面的查詢也將導(dǎo)致全表掃描: select id from t where name like ‘%abc%'

5、如果在 where 子句中使用參數(shù),也會(huì)導(dǎo)致全表掃描。因?yàn)镾QL只有在運(yùn)行時(shí)才會(huì)解析局部變量,但優(yōu)化程序不能將訪問計(jì)劃的選擇推遲到運(yùn)行時(shí);它必須在編譯時(shí)進(jìn)行選擇。然而,如果在編譯時(shí)建立訪問計(jì)劃,變量的值還是未知的,因而無法作為索引選擇的輸入項(xiàng)。如下面語句將進(jìn)行全表掃描: select id from t where num=@num 可以改為強(qiáng)制查詢使用索引: select id from t with(index(索引名)) where num=@num;

6、應(yīng)盡量避免在 where 子句中對(duì)字段進(jìn)行表達(dá)式操作,這將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。如: select id from t where num/2=100 應(yīng)改為: select id from t where num=100*2;

7、應(yīng)盡量避免在where子句中對(duì)字段進(jìn)行函數(shù)操作,這將導(dǎo)致引擎放棄使用索引而進(jìn)行全表掃描。如: select id from t where substring(name,1,3)='abc'–name以abc開頭的id,select id from t where datediff(day,createdate,'2005-11-30′)=0–‘2005-11-30'生成的id 應(yīng)改為: select id from t where name like ‘a(chǎn)bc%' select id from t where createdate>='2005-11-30′ and createdate<'2005-12-1′

8、不要在 where 子句中的“=”左邊進(jìn)行函數(shù)、算術(shù)運(yùn)算或其他表達(dá)式運(yùn)算,否則系統(tǒng)將可能無法正確使用索引。

9、不要寫一些沒有意義的查詢,如需要生成一個(gè)空表結(jié)構(gòu): select col1,col2 into #t from t where 1=0 這類代碼不會(huì)返回任何結(jié)果集,但是會(huì)消耗系統(tǒng)資源的,應(yīng)改成這樣: create table #t(…)

10、很多時(shí)候用 exists 代替 in 是一個(gè)好的選擇: select num from a where num in(select num from b) 用下面的語句替換: select num from a where exists(select 1 from b where num=a.num)

11、任何地方都不要使用 select * from t ,用具體的字段列表代替“*”,不要返回用不到的任何字段。

12、盡量避免使用游標(biāo),因?yàn)橛螛?biāo)的效率較差,如果游標(biāo)操作的數(shù)據(jù)超過1萬行,那么就應(yīng)該考慮改寫。

13、盡量避免向客戶端返回大數(shù)據(jù)量,若數(shù)據(jù)量過大,應(yīng)該考慮相應(yīng)需求是否合理。

14、盡量避免大事務(wù)操作,提高系統(tǒng)并發(fā)能力。

三、Java方面(重點(diǎn)內(nèi)容)

1、盡可能的少造對(duì)象;

2、合理擺正系統(tǒng)設(shè)計(jì)的位置。大量數(shù)據(jù)操作,和少量數(shù)據(jù)操作一定是分開的。大量的數(shù)據(jù)操作,肯定不是ORM框架搞定的;

3、使用JDBC鏈接數(shù)據(jù)庫操作數(shù)據(jù);

4、控制好內(nèi)存,讓數(shù)據(jù)流起來,而不是全部讀到內(nèi)存再處理,而是邊讀取邊處理;

5、合理利用內(nèi)存,有的數(shù)據(jù)要緩存;

四、如何優(yōu)化數(shù)據(jù)庫,如何提高數(shù)據(jù)庫的性能?

1、硬件調(diào)整性能

最有可能影響性能的是磁盤和網(wǎng)絡(luò)吞吐量,解決辦法擴(kuò)大虛擬內(nèi)存,并保證有足夠可以擴(kuò)充的空間;把數(shù)據(jù)庫服務(wù)器上的不必要服務(wù)關(guān)閉掉;把數(shù)據(jù)庫服務(wù)器和主域服務(wù)器分開;把SQL數(shù)據(jù)庫服務(wù)器的吞吐量調(diào)為最大;在具有一個(gè)以上處理器的機(jī)器上運(yùn)行SQL。

2、調(diào)整數(shù)據(jù)庫

若對(duì)該表的查詢頻率比較高,則建立索引;建立索引時(shí),想盡對(duì)該表的所有查詢搜索操作, 按照where選擇條件建立索引,盡量為整型鍵建立為有且只有一個(gè)簇集索引,數(shù)據(jù)在物理上按順序在數(shù)據(jù)頁上,縮短查找范圍,為在查詢經(jīng)常使用的全部列建立非簇集索引,能最大地覆蓋查詢;但是索引不可太多,執(zhí)行UPDATE DELETE INSERT語句需要用于維護(hù)這些索引的開銷量急劇增加;避免在索引中有太多的索引鍵;避免使用大型數(shù)據(jù)類型的列為索引;保證每個(gè)索引鍵值有少數(shù)行。

3、使用存儲(chǔ)過程(注意:阿里巴巴開發(fā)規(guī)范中已經(jīng)明確禁止使用存儲(chǔ)過程了,這里只是列出,不作為優(yōu)化方法!)

應(yīng)用程序的實(shí)現(xiàn)過程中,能夠采用存儲(chǔ)過程實(shí)現(xiàn)的對(duì)數(shù)據(jù)庫的操作盡量通過存儲(chǔ)過程來實(shí)現(xiàn),因?yàn)榇鎯?chǔ)過程是存放在數(shù)據(jù)庫服務(wù)器上的一次性被設(shè)計(jì)、編碼、測試,并被再次使用,需要執(zhí)行該任務(wù)的應(yīng)用可以簡單地執(zhí)行存儲(chǔ)過程,并且只返回結(jié)果集或者數(shù)值,這樣不僅可以使程序模塊化,同時(shí)提高響應(yīng)速度,減少網(wǎng)絡(luò)流量,并且通過輸入?yún)?shù)接受輸入,使得在應(yīng)用中完成邏輯的一致性實(shí)現(xiàn)。

4、應(yīng)用程序結(jié)構(gòu)和算法

建立查詢條件索引僅僅是提高速度的前提條件,響應(yīng)速度的提高還依賴于對(duì)索引的使用。因?yàn)槿藗冊(cè)谑褂肧QL時(shí)往往會(huì)陷入一個(gè)誤區(qū),即太關(guān)注于所得的結(jié)果是否正確,特別是對(duì)數(shù)據(jù)量不是特別大的數(shù)據(jù)庫操作時(shí),是否建立索引和使用索引的好壞對(duì)程序的響應(yīng)速度并不大,因此程序員在書寫程序時(shí)就忽略了不同的實(shí)現(xiàn)方法之間可能存在的性能差異,這種性能差異在數(shù)據(jù)量特別大時(shí)或者大型的或是復(fù)雜的數(shù)據(jù)庫環(huán)境中(如聯(lián)機(jī)事務(wù)處理OLTP或決策支持系統(tǒng)DSS)中表現(xiàn)得尤為明顯。在工作實(shí)踐中發(fā)現(xiàn),不良的SQL往往來自于不恰當(dāng)?shù)乃饕O(shè)計(jì)、不充份的連接條件和不可優(yōu)化的where子句。在對(duì)它們進(jìn)行適當(dāng)?shù)膬?yōu)化后,其運(yùn)行速度有了明顯地提高!

以上是“怎么在一個(gè)千萬級(jí)的數(shù)據(jù)庫查詢中提高查詢的效率”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI