溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

發(fā)布時(shí)間:2021-08-07 10:31:57 來(lái)源:億速云 閱讀:210 作者:小新 欄目:開(kāi)發(fā)技術(shù)

這篇文章主要介紹了Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

面試題1:說(shuō)一下你對(duì)聚集索引與非聚集索引的理解,以及他們的區(qū)別?

首先解釋一下,什么是聚集索引和非聚集索引。這里我想起網(wǎng)上看到的一個(gè)典型的例子:

說(shuō)索引像一個(gè)漢語(yǔ)字典,聚集索引是根據(jù)拼音查詢(xún),而非聚集索引是根據(jù)偏旁部首查詢(xún),你想想哪個(gè)查的快?

漢語(yǔ)字典的正文本身就是一個(gè)聚集索引。比如,我們要查“啊”字,拼音是“a”,按照拼音排序是以“a”開(kāi)頭“z”結(jié)尾的,那么“啊”字就自然地排在字典的前部。如果翻完了所有以“a”開(kāi)頭的內(nèi)容仍然找不到這個(gè)字,那么就說(shuō)明字典中就沒(méi)有這個(gè)字。我們知道,其實(shí)字典的正文部分本身就是一個(gè)目錄,不需要再去查其他目錄來(lái)找到我們需要找的內(nèi)容。我們把這種正文內(nèi)容本身就按照一定規(guī)則排列(有序)的目錄稱(chēng)為“聚集索引”。

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

問(wèn)題來(lái)了,遇到不認(rèn)識(shí)的字,不知道它的發(fā)音,怎么辦?

這時(shí)候,就得用“偏旁部首”查了吧,然后根據(jù)這個(gè)偏旁后的頁(yè)碼來(lái)找字。這種結(jié)合“部首目錄”和“檢字表”查到的字的排序并不是真正的正文的排序方法,比如查“張”字,我們可以看到在查部首之后的檢字表中“張”的頁(yè)碼是672頁(yè),檢字表中“張”的上面是“馳”字,但頁(yè)碼卻是63頁(yè),“張”的下面是“弩”字,頁(yè)面是390頁(yè)。很顯然,這些字并不是真正的分別位于“張”字的上下方,現(xiàn)在看到的連續(xù)的“馳、張、弩”三字實(shí)際上就是他們?cè)诜蔷奂饕械呐判颍亲值湔闹械淖衷诜蔷奂饕械挠成洹?/p>

我們可以通過(guò)這種方式來(lái)找到我們所需要的字,但它需要兩個(gè)過(guò)程,先找到目錄中的結(jié)果,然后再翻到相應(yīng)頁(yè)碼。我們把這種目錄純粹是目錄,正文純粹是正文的排序方式(無(wú)序)稱(chēng)為“非聚集索引”。

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

1、聚集索引

聚集索引是我們常用的一種索引,該索引中鍵值的邏輯順序決定了表中相應(yīng)行的物理順序,我們?nèi)~子結(jié)點(diǎn)直接對(duì)應(yīng)的實(shí)際數(shù)據(jù),當(dāng)索引值唯一(unique)時(shí),使用聚集索引查找特定的行效率很高。例如,使用唯一店員 ID 列 emp_id 查找特定雇員的最快速的方法,是在 emp_id 列上創(chuàng)建聚集索引或 PRIMARY KEY 約束??梢?jiàn),自增主鍵就是一個(gè)標(biāo)準(zhǔn)的聚集索引。

當(dāng)某列滿(mǎn)足兩個(gè)條件時(shí),我們可以創(chuàng)建聚集索引:

  • 數(shù)據(jù)存儲(chǔ)有序(如自增)

  • key值應(yīng)當(dāng)唯一

聚簇索引像字典,字典按字母順序排列數(shù)據(jù),有序。在聚集索引中,索引包含指向數(shù)據(jù)存儲(chǔ)的塊而不是數(shù)據(jù)存儲(chǔ)地址的指針,和非聚集索引(Normal)相反。

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

2、非聚集索引

非聚集索引就是索引類(lèi)型為Normal的普通索引啦,我們?cè)凇读牧?a title="MySQL" target="_blank" href="http://www.kemok4.com/mysql/">MySQL索引“B+Tree”的前世今生》這篇文章中提到,B+Tree(這里是索引類(lèi)型是Normal)所有關(guān)鍵字存儲(chǔ)在葉子節(jié)點(diǎn),但不存儲(chǔ)真正的data,葉子結(jié)點(diǎn)存的是一個(gè)指向磁盤(pán)data的指針,需要到磁盤(pán)數(shù)據(jù)頁(yè)中取。

非聚集索引的數(shù)據(jù)存儲(chǔ)在一個(gè)位置,索引存儲(chǔ)在另一位置。由于數(shù)據(jù)和非聚集索引是分開(kāi)存儲(chǔ)的,因此在一個(gè)表中可以有多個(gè)非聚集索引。

聚集索引 和 非聚集索引的區(qū)別:

  • 單表中只能有一個(gè)聚集索引,而非聚集索引單表可以存在多個(gè)。

  • 聚集索引,索引中鍵值的邏輯順序決定了表中相應(yīng)行的物理順序;非聚集索引,索引中索引的邏輯順序與磁盤(pán)上行的物理存儲(chǔ)順序不同。

  • 索引是通過(guò)二叉樹(shù)的數(shù)據(jù)結(jié)構(gòu)來(lái)描述的,我們可以這么理解聚簇索引:索引的葉節(jié)點(diǎn)就是數(shù)據(jù)節(jié)點(diǎn)。而非聚簇索引的葉節(jié)點(diǎn)仍然是索引節(jié)點(diǎn),只不過(guò)有一個(gè)指針指向?qū)?yīng)的數(shù)據(jù)塊。

  • 聚集索引:物理存儲(chǔ)按照索引排序;非聚集索引:物理存儲(chǔ)不按照索引排序;

追問(wèn)1:為什么聚集索引可以創(chuàng)建在任何一列上,如果此表沒(méi)有主鍵約束,即有可能存在重復(fù)行數(shù)據(jù)呢?

乍一看,這還真是和聚集索引的約束相背,但實(shí)際情況真可以創(chuàng)建聚集索引。

其原因是:如果未使用 UNIQUE 屬性創(chuàng)建聚集索引,數(shù)據(jù)庫(kù)引擎將向表自動(dòng)添加一個(gè)四字節(jié) uniqueifier列。必要時(shí),數(shù)據(jù)庫(kù)引擎 將向行自動(dòng)添加一個(gè) uniqueifier 值,使每個(gè)鍵唯一。此列和列值供內(nèi)部使用,用戶(hù)不能查看或訪問(wèn)。

追問(wèn)2:聚集索引一定比非聚集索引性能優(yōu)么?

如果想查詢(xún)學(xué)分在60-90之間的學(xué)生的學(xué)分以及姓名,在學(xué)分上創(chuàng)建聚集索引是否是最優(yōu)的呢?

并不是。既然只輸出兩列,我們可以在學(xué)分以及學(xué)生姓名上創(chuàng)建聯(lián)合非聚集索引,此時(shí)的索引就形成了覆蓋索引,即索引所存儲(chǔ)的內(nèi)容就是最終輸出的數(shù)據(jù),這種索引當(dāng)然比以學(xué)分為聚集索引做查詢(xún)性能好,算是相當(dāng)于聯(lián)合聚集索引~~靈活運(yùn)用即可。

面試題2:說(shuō)一說(shuō)你對(duì) B樹(shù) 和 B+樹(shù) 的理解吧

1、B樹(shù)(Balanced Tree)多路平衡查找樹(shù) 多叉

B樹(shù)是一種多路自平衡搜索樹(shù),它類(lèi)似普通的二叉樹(shù),但是B書(shū)允許每個(gè)節(jié)點(diǎn)有更多的子節(jié)點(diǎn)。B樹(shù)示意圖如下:值得注意的是,B樹(shù)的非葉子節(jié)點(diǎn)和葉子結(jié)點(diǎn)的data數(shù)據(jù)都是分開(kāi)存儲(chǔ)的,那么針對(duì)范圍查詢(xún)、排序等常用特性就很不友好了。

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

B樹(shù)的特點(diǎn):

  • 所有鍵值分布在整個(gè)樹(shù)中

  • 任何關(guān)鍵字出現(xiàn)且只出現(xiàn)在一個(gè)節(jié)點(diǎn)中

  • 搜索有可能在非葉子節(jié)點(diǎn)結(jié)束

  • 在關(guān)鍵字全集內(nèi)做一次查找,性能逼近二分查找算法

為了提升效率,要盡量減少磁盤(pán)I/O的次數(shù)。實(shí)際過(guò)程中,磁盤(pán)并不是每次嚴(yán)格按需讀取,而是每次都會(huì)預(yù)讀。

磁盤(pán)讀取完需要的數(shù)據(jù)后,會(huì)按順序再多讀一部分?jǐn)?shù)據(jù)到內(nèi)存中,這樣做的理論依據(jù)是計(jì)算機(jī)科學(xué)中注明的局部性原理:

  • 由于磁盤(pán)順序讀取的效率很高(不需要尋址時(shí)間,只需很少的旋轉(zhuǎn)時(shí)間),因此對(duì)于具有局部性的程序來(lái)說(shuō),預(yù)讀可以提高I/O效率.預(yù)讀的長(zhǎng)度一般為頁(yè)(page)的整倍數(shù)。

  • MySQL(默認(rèn)使用InnoDB引擎),將記錄按照頁(yè)的方式進(jìn)行管理,每頁(yè)大小默認(rèn)為16K(可以修改)。

B-Tree借助計(jì)算機(jī)磁盤(pán)預(yù)讀機(jī)制:

每次新建節(jié)點(diǎn)的時(shí)候,都是申請(qǐng)一個(gè)頁(yè)的空間,所以每查找一個(gè)節(jié)點(diǎn)只需要一次I/O;因?yàn)閷?shí)際應(yīng)用當(dāng)中,節(jié)點(diǎn)深度會(huì)很少,所以查找效率很高.

2、B+ Tree (B+樹(shù)是B樹(shù)的變體,也是一種多路搜索樹(shù))

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

從圖中也可以看到,B+樹(shù)與B樹(shù)的不同在于:

  • 所有關(guān)鍵字存儲(chǔ)在葉子節(jié)點(diǎn),非葉子節(jié)點(diǎn)不存儲(chǔ)真正的data,從而可以快速定位到葉子結(jié)點(diǎn)。

  • 為所有葉子節(jié)點(diǎn)增加了一個(gè)鏈指針,意味著所有的值都是按順序存儲(chǔ)的,并且每一個(gè)葉子頁(yè)到根的距離相同,很適合查找范圍數(shù)據(jù)。說(shuō)明支持范圍查詢(xún)和天然排序。

因此,B+Tree可以對(duì)<,<=,=,>,>=,BETWEEN,IN,以及不以通配符開(kāi)始的LIKE使用索引。且如果用到了該索引,排序功能的消耗大大減少。

B+樹(shù)的優(yōu)點(diǎn):

比較的次數(shù)均衡,減少了I/O次數(shù),提高了查找速度,查找也更穩(wěn)定。

  • B+樹(shù)的磁盤(pán)讀寫(xiě)代價(jià)更低

  • B+樹(shù)的查詢(xún)效率更加穩(wěn)定

??要知道的是,你每次創(chuàng)建表,系統(tǒng)會(huì)為你自動(dòng)創(chuàng)建一個(gè)基于ID的聚集索引(上述B+樹(shù)),存儲(chǔ)全部數(shù)據(jù);你每次增加索引,數(shù)據(jù)庫(kù)就會(huì)為你創(chuàng)建一個(gè)附加索引(上述B+樹(shù)),索引選取的字段個(gè)數(shù)就是每個(gè)節(jié)點(diǎn)存儲(chǔ)數(shù)據(jù)索引的個(gè)數(shù),注意該索引并不存儲(chǔ)全部數(shù)據(jù)。

面試題3:說(shuō)一下你對(duì)最左前綴原則的理解吧

通常我們?cè)诮⒙?lián)合索引的時(shí)候,相信建立過(guò)索引的同學(xué)們會(huì)發(fā)現(xiàn),無(wú)論是Oracle還是 MySQL 都會(huì)讓我們選擇索引的順序,比如我們想在a,b,c三個(gè)字段上建立一個(gè)聯(lián)合索引,我們可以選擇自己想要的優(yōu)先級(jí),(a、b、c),或是 (b、a、c) 或者是(c、a、b) 等順序。

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

為什么數(shù)據(jù)庫(kù)會(huì)讓我們選擇字段的順序呢?不都是三個(gè)字段的聯(lián)合索引么?這里就引出了數(shù)據(jù)庫(kù)索引的最重要的原則之一,最左匹配原則。

在我們開(kāi)發(fā)中經(jīng)常會(huì)遇到這種問(wèn)題,明明這個(gè)字段建了聯(lián)合索引,但是SQL查詢(xún)?cè)撟侄螘r(shí)卻不會(huì)使用這個(gè)索引。難道這索引是假的?白嫖老子資源?!

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些

比如索引abc_index:(a,b,c)是a,b,c三個(gè)字段的聯(lián)合索引,下列sql執(zhí)行時(shí)都無(wú)法命中索引abc_index;

select * from table where c = '1';
select * from table where b ='1' and c ='2';

以下三種情況卻會(huì)走索引:

select * from table where a = '1';
select * from table where a = '1' and b = '2';
select * from table where a = '1' and b = '2'  and c='3';

從上面兩個(gè)例子大家有木有看出點(diǎn)眉目呢?

是的,索引abc_index:(a,b,c),只會(huì)在where條件中帶有(a)、(a,b)、(a,b,c)的三種類(lèi)型的查詢(xún)中使用。其實(shí)這里說(shuō)的有一點(diǎn)歧義,其實(shí)當(dāng)where條件只有(a,c)時(shí)也會(huì)走,但是只走a字段索引,不會(huì)走c字段。

那么這都是為什么呢?我們一起來(lái)看看其原理吧。

一、最左匹配原則的原理

MySQL 建立多列索引(聯(lián)合索引)有最左匹配的原則,即最左優(yōu)先:
如果有一個(gè) 2 列的索引 (a, b),則已經(jīng)對(duì) (a)、(a, b) 上建立了索引;
如果有一個(gè) 3 列索引 (a, b, c),則已經(jīng)對(duì) (a)、(a, b)、(a, b, c) 上建立了索引;

假設(shè)數(shù)據(jù) 表 LOL (id,sex,price,name) 的物理位置(表中的無(wú)序數(shù)據(jù))如下:
(注:下面數(shù)據(jù)是測(cè)試少量數(shù)據(jù)選用的,只為了方便大家看清楚。實(shí)際操作中,應(yīng)按照使用頻率、數(shù)據(jù)區(qū)分度來(lái)綜合設(shè)定索引順序~)

主鍵id  sex(a)   price(b)      name(c)    
(1)     1         1350         AAA安妮
(2)     2         6300         MMM盲僧
(3)     1         3150         NNN奈德麗
(4)     2         6300         CCC錘石
(5)     1         6300         LLL龍女
(6)     2         3150         EEE伊澤瑞爾
(7)     2         6300         III艾克
(8)     1         6300         BBB暴走蘿莉
(9)     1         4800         FFF發(fā)條魔靈
(10)    2         3150         KKK卡牌大師
(11)    1         450          HHH寒冰射手
(12)    2         450          GGG蓋倫
(13)    2         3150         OOO小提莫
(14)    2         3150         DDD刀鋒之影
(15)    2         6300         JJJ疾風(fēng)劍豪
(16)    2         450          JJJ劍圣

當(dāng)你在LOL表創(chuàng)建一個(gè)聯(lián)合索引 abc_index:(sex,price,name)時(shí),生成的索引文件邏輯上等同于下表內(nèi)容(分級(jí)排序):

sex(a)   price(b)       name(c)         主鍵id
1        450            HHH寒冰射手      (11)
1        1350           AAA安妮          (1)
1        3150           NNN奈德麗        (3)
1        4800           FFF發(fā)條魔靈       (9)
1        6300           BBB暴走蘿莉       (8)
1        6300           LLL龍女          (5)
2        450            GGG蓋倫          (12)
2        450            JJJ劍圣          (16)
2        3150           DDD刀鋒之影       (14)
2        3150           EEE伊澤瑞爾       (6)
2        3150           KKK卡牌大師       (10)
2        3150           OOO小提莫         (13)
2        6300           CCC錘石          (4)
2        6300           III艾克          (7)
2        6300           JJJ疾風(fēng)劍豪       (15)
2        6300           MMM盲僧          (2)

小伙伴兒們有沒(méi)有發(fā)現(xiàn)B+樹(shù)聯(lián)合索引的規(guī)律?感覺(jué)還有點(diǎn)模糊的話,那咱們?cè)賮?lái)看一張索引存儲(chǔ)數(shù)據(jù)的結(jié)構(gòu)圖,或許更明了一些。

Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些??

這是一張來(lái)自思否上的圖片,層次感很清晰,小伙伴可以看到,對(duì)于B+樹(shù)中的聯(lián)合索引,每級(jí)索引都是排好序的。聯(lián)合索引 bcd_index:(b,c,d) , 在索引樹(shù)中的樣子如圖 , 在比較的過(guò)程中 ,先判斷 b 再判斷 c 然后是 d 。

由上圖可以看出,B+ 樹(shù)的數(shù)據(jù)項(xiàng)是復(fù)合的數(shù)據(jù)結(jié)構(gòu),同樣,對(duì)于我們這張表的聯(lián)合索引 (sex,price,name)來(lái)說(shuō) ,B+ 樹(shù)也是按照從左到右的順序來(lái)建立搜索樹(shù)的,當(dāng)SQL如下時(shí):

select sex,price,name from LOL where sex = 2 and price = 6300 and name = 'JJJ疾風(fēng)劍豪';

B+ 樹(shù)會(huì)優(yōu)先比較 sex 來(lái)確定下一步的指針?biāo)逊较颍绻?sex 相同再依次比較 price 和 name,最后得到檢索的數(shù)據(jù);

二、違背最左原則導(dǎo)致索引失效的情況

(下面以聯(lián)合索引 abc_index:(a,b,c) 來(lái)進(jìn)行講解,便于理解)

1、查詢(xún)條件中,缺失優(yōu)先級(jí)最高的索引 “a”

當(dāng) where b = 6300 and c = 'JJJ疾風(fēng)劍豪' 這種沒(méi)有以 a 為條件來(lái)檢索時(shí);B+樹(shù)就不知道第一步該查哪個(gè)節(jié)點(diǎn),從而需要去全表掃描了(即不走索引)。因?yàn)榻⑺阉鳂?shù)的時(shí)候 a 就是第一個(gè)比較因子,必須要先根據(jù) a 來(lái)搜索,進(jìn)而才能往后繼續(xù)查詢(xún)b 和 c,這點(diǎn)我們通過(guò)上面的存儲(chǔ)結(jié)構(gòu)圖可以看明白。

2、查詢(xún)條件中,缺失優(yōu)先級(jí)居中的索引 “b”

當(dāng) where a =1 and c =“JJJ疾風(fēng)劍豪” 這樣的數(shù)據(jù)來(lái)檢索時(shí);B+ 樹(shù)可以用 a 來(lái)指定第一步搜索方向,但由于下一個(gè)字段 b 的缺失,所以只能把 a = 1 的數(shù)據(jù)主鍵ID都找到,通過(guò)查到的主鍵ID回表查詢(xún)相關(guān)行,再去匹配 c = ‘JJJ疾風(fēng)劍豪' 的數(shù)據(jù)了,當(dāng)然,這至少把 a = 1 的數(shù)據(jù)篩選出來(lái)了,總比直接全表掃描好多了。

這就是MySQL非常重要的原則,即索引的最左匹配原則。

三、查詢(xún)優(yōu)化器偷偷干了哪些事兒

當(dāng)對(duì)索引中所有列通過(guò)"=" 或 “IN” 進(jìn)行精確匹配時(shí),索引都可以被用到。

1、如果建的索引順序是 (a, b)。而查詢(xún)的語(yǔ)句是 where b = 1 AND a = ‘陳哈哈'; 為什么還能利用到索引?

理論上索引對(duì)順序是敏感的,但是由于 MySQL 的查詢(xún)優(yōu)化器會(huì)自動(dòng)調(diào)整 where 子句的條件順序以使用適合的索引,所以 MySQL 不存在 where 子句的順序問(wèn)題而造成索引失效。當(dāng)然了,SQL書(shū)寫(xiě)的好習(xí)慣要保持,這也能讓其他同事更好地理解你的SQL。

2、還有一個(gè)特殊情況說(shuō)明下,下面這種類(lèi)型的SQL, a 與 b 會(huì)走索引,c不會(huì)走。
select * from LOL where a = 2 and b > 1000  and c='JJJ疾風(fēng)劍豪';

對(duì)于上面這種類(lèi)型的sql語(yǔ)句;mysql會(huì)一直向右匹配直到遇到范圍查詢(xún)(>、<、between、like)就停止匹配(包括like '陳%'這種)。在a、b走完索引后,c已經(jīng)是無(wú)序了,所以c就沒(méi)法走索引,優(yōu)化器會(huì)認(rèn)為還不如全表掃描c字段來(lái)的快。所以只使用了(a,b)兩個(gè)索引,影響了執(zhí)行效率。

其實(shí),這種場(chǎng)景可以通過(guò)修改索引順序?yàn)?abc_index:(a,c,b),就可以使三個(gè)索引字段都用到索引,建議小伙伴們不要有問(wèn)題就想著新增索引哦,浪費(fèi)資源還增加服務(wù)器壓力。

綜上,如果通過(guò)調(diào)整順序,就可以解決問(wèn)題或少維護(hù)一個(gè)索引,那么這個(gè)順序往往就是我們DBA人員需要優(yōu)先考慮采用的。

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“Java中關(guān)于數(shù)據(jù)庫(kù)的面試題有哪些”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI