溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Lucene的文件結(jié)構(gòu)是怎樣的

發(fā)布時(shí)間:2021-12-23 09:19:17 來源:億速云 閱讀:148 作者:iii 欄目:云計(jì)算

本篇內(nèi)容主要講解“Lucene的文件結(jié)構(gòu)是怎樣的”,感興趣的朋友不妨來看看。本文介紹的方法操作簡(jiǎn)單快捷,實(shí)用性強(qiáng)。下面就讓小編來帶大家學(xué)習(xí)“Lucene的文件結(jié)構(gòu)是怎樣的”吧!

Lucene的文件結(jié)構(gòu)是一個(gè)層次結(jié)構(gòu)。

Lucene文件層次結(jié)構(gòu)包含:

Lucene的文件結(jié)構(gòu)是怎樣的

如果非要打一個(gè)比方:

這里的索引相當(dāng)于數(shù)據(jù)庫(kù)中的表,當(dāng)表中的記錄達(dá)到一定的量之后,我們要對(duì)表進(jìn)行分區(qū)操作。

這里的段就相當(dāng)于表的分區(qū)。

也就是說,索引可以分解成多個(gè)段。

數(shù)據(jù)表中的記錄又保存不同的分區(qū)中內(nèi),這里的文檔就相當(dāng)于數(shù)據(jù)庫(kù)表中的記錄。不同的文檔保存在不同的段中。

與表的分區(qū)略有不同的是,這里的段可以合并成一個(gè)新段。

一個(gè)索引包含多個(gè)段,每個(gè)段包含一個(gè)或多個(gè)文檔,文檔中包含多個(gè)域,域可以進(jìn)行分詞劃分成一個(gè)或多個(gè)詞元。

Lucene索引中保存了正向信息和反向信息。

正向信息:按層次保存了索引到詞的包含關(guān)系。

索引-段-文檔-域-詞

一個(gè)索引包含哪些段,每個(gè)段包含哪些文檔,文檔中包含哪些域,域劃分成哪些詞元。

反向信息:詞到文檔的映射關(guān)系。

在本系列前面的文章(1)中,我們將這種從詞到文檔的映射關(guān)系,定義為倒排表。通過倒排表,我們可以看到每一個(gè)詞分別在哪些文檔中出現(xiàn)。

Lucene的文件結(jié)構(gòu)是怎樣的

到此,相信大家對(duì)“Lucene的文件結(jié)構(gòu)是怎樣的”有了更深的了解,不妨來實(shí)際操作一番吧!這里是億速云網(wǎng)站,更多相關(guān)內(nèi)容可以進(jìn)入相關(guān)頻道進(jìn)行查詢,關(guān)注我們,繼續(xù)學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI