您好,登錄后才能下訂單哦!
本篇內(nèi)容主要講解“Lucene的文件結(jié)構(gòu)是怎樣的”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“Lucene的文件結(jié)構(gòu)是怎樣的”吧!
Lucene的文件結(jié)構(gòu)是一個(gè)層次結(jié)構(gòu)。
Lucene文件層次結(jié)構(gòu)包含:
如果非要打一個(gè)比方:
這里的索引相當(dāng)于數(shù)據(jù)庫(kù)中的表,當(dāng)表中的記錄達(dá)到一定的量之后,我們要對(duì)表進(jìn)行分區(qū)操作。
這里的段就相當(dāng)于表的分區(qū)。
也就是說,索引可以分解成多個(gè)段。
數(shù)據(jù)表中的記錄又保存不同的分區(qū)中內(nèi),這里的文檔就相當(dāng)于數(shù)據(jù)庫(kù)表中的記錄。不同的文檔保存在不同的段中。
與表的分區(qū)略有不同的是,這里的段可以合并成一個(gè)新段。
一個(gè)索引包含多個(gè)段,每個(gè)段包含一個(gè)或多個(gè)文檔,文檔中包含多個(gè)域,域可以進(jìn)行分詞劃分成一個(gè)或多個(gè)詞元。
Lucene索引中保存了正向信息和反向信息。
正向信息:按層次保存了索引到詞的包含關(guān)系。
索引-段-文檔-域-詞
一個(gè)索引包含哪些段,每個(gè)段包含哪些文檔,文檔中包含哪些域,域劃分成哪些詞元。
反向信息:詞到文檔的映射關(guān)系。
在本系列前面的文章(1)中,我們將這種從詞到文檔的映射關(guān)系,定義為倒排表。通過倒排表,我們可以看到每一個(gè)詞分別在哪些文檔中出現(xiàn)。
到此,相信大家對(duì)“Lucene的文件結(jié)構(gòu)是怎樣的”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。