溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Java中的搜索引擎框架有哪些

發(fā)布時(shí)間:2021-07-01 14:53:35 來(lái)源:億速云 閱讀:183 作者:Leah 欄目:大數(shù)據(jù)

本篇文章為大家展示了Java中的搜索引擎框架有哪些,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。

1、Java 全文搜索引擎框架 Lucene

毫無(wú)疑問(wèn),Lucene是目前最受歡迎的Java全文搜索框架,準(zhǔn)確地說(shuō),它是一個(gè)全文檢索引擎的架構(gòu),提供了完整的查詢引擎和索引引擎,部分文本分析引擎。Lucene為開(kāi)發(fā)人員提供了相當(dāng)完整的工具包,可以非常方便地實(shí)現(xiàn)強(qiáng)大的全文檢索功能。下面有幾款搜索引擎框架也是基于Lucene實(shí)現(xiàn)的。

2、開(kāi)源Java搜索引擎Nutch

Nutch 是一個(gè)開(kāi)源Java實(shí)現(xiàn)的搜索引擎。它提供了我們運(yùn)行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬蟲(chóng)。

利用Nutch,你可以做到以下這些功能:

  • 每個(gè)月取幾十億網(wǎng)頁(yè)

  • 為這些網(wǎng)頁(yè)維護(hù)一個(gè)索引

  • 對(duì)索引文件進(jìn)行每秒上千次的搜索

  • 提供高質(zhì)量的搜索結(jié)果

  • 以最小的成本運(yùn)作

3、分布式搜索引擎 ElasticSearch

ElasticSearch就是一款基于Lucene框架的分布式搜索引擎,并且也是一款為數(shù)不多的基于JSON進(jìn)行索引的搜索引擎。ElasticSearch特別適合在云計(jì)算平臺(tái)上使用。

4、實(shí)時(shí)分布式搜索引擎 Solandra

Solandra 是一個(gè)實(shí)時(shí)的分布式搜索引擎,基于 Apache Solr 和 Apache Cassandra 構(gòu)建。

其特性如下:

  • 支持Solr的大多數(shù)默認(rèn)特性 (search, faceting, highlights)

  • 數(shù)據(jù)復(fù)制,分片,緩存及壓縮這些都由Cassandra來(lái)進(jìn)行

  • Multi-master (任意結(jié)點(diǎn)都可供讀寫(xiě))

  • 實(shí)時(shí)性高,寫(xiě)操作完成即可讀到

  • Easily add new SolrCores w/o restart across the cluster 輕松添加及重啟結(jié)點(diǎn)

5、IndexTank

IndexTank是一套基于Java的索引-實(shí)時(shí)全文搜索引擎實(shí)現(xiàn),IndexTank有以下幾個(gè)特點(diǎn):

  • 索引更新實(shí)時(shí)生效

  • 地理位置搜索

  • 支持多種客戶端語(yǔ)言
    Ruby, Rails, Python, Java, PHP, .NET & more!

  • 支持靈活的排序與評(píng)分控制

  • 支持自動(dòng)完成

  • 支持面搜索(facet search)

  • 支持匹配高亮

  • 支持海量數(shù)據(jù)擴(kuò)展(Scalable from a personal blog to hundreds of millions of documents! )

  • 支持動(dòng)態(tài)數(shù)據(jù)

6、搜索引擎 Compass

Compass是一個(gè)強(qiáng)大的,事務(wù)的,高性能的對(duì)象/搜索引擎映射(OSEM:object/search engine mapping)與一個(gè)Java持久層框架.Compass包括:

  • 搜索引擎抽象層(使用Lucene搜索引薦)

  • OSEM (Object/Search Engine Mapping) 支持

  • 事務(wù)管理

  • 類似于Google的簡(jiǎn)單關(guān)鍵字查詢語(yǔ)言

  • 可擴(kuò)展與模塊化的框架

  • 簡(jiǎn)單的API

7、Java全文搜索服務(wù)器 Solr

Solr也是基于Java實(shí)現(xiàn)的,并且是基于Lucene實(shí)現(xiàn)的,Solr的主要特性包括:高效、靈活的緩存功能,垂直搜索功能,高亮顯示搜索結(jié)果。值得注意的是,Solr還提供一款很棒的Web界面來(lái)管理索引的數(shù)據(jù)。

8、Lucene圖片搜索 LIRE

LIRE是一款基于Java的圖片搜索框架,其核心也是基于Lucene的,利用該索引就能夠構(gòu)建一個(gè)基于內(nèi)容的圖像檢索(content- based image retrieval,CBIR)系統(tǒng),來(lái)搜索相似的圖像。

9、全文本搜索引擎 Egothor

Egothor是一個(gè)用Java編寫(xiě)的開(kāi)源而高效的全文本搜索引擎。借助Java的跨平臺(tái)特性,Egothor能應(yīng)用于任何環(huán)境的應(yīng)用,既可配置為單獨(dú)的搜索引擎,又能用于你的應(yīng)用作為全文檢索之用。

上述內(nèi)容就是Java中的搜索引擎框架有哪些,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI