溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

CDH如何添加solr中文分詞

發(fā)布時間:2021-12-17 09:18:52 來源:億速云 閱讀:179 作者:小新 欄目:云計算

小編給大家分享一下CDH如何添加solr中文分詞,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

cdh最難找的就是solr\WEB-INF\lib的位置,由于cdh不是我安裝的,也沒有配置    SOLR_HOME,所以,我找了很久時間??梢在Afind命令找。

solr本身對中文分詞的處理不是太好,所以中文應(yīng)用很多時候都需要額外加一個中文分詞器對中文進(jìn)行分詞處理,ik-analyzer就是其中一個不錯的中文分詞器。
一、版本信息
solr版本:4.10.0
需要ik-analyzer版本:IK Analyzer 2012FF_hf1

二、配置步驟
下載壓縮解壓
我們把IKAnalyzer2012FF_u1.jar拷貝到solr服務(wù)的solr\WEB-INF\lib下面。注意:如果是cdh這個路徑有變動,我的為:

/opt/cloudera/parcels/CDH-5.4.4-1.cdh6.4.4.pp0.4/lib/solr/webapps/solr/WEB-INF/lib

在高版本的CDH中,位置為:/usr/lib/solr/webapps/solr/WEB-INF/lib

如果不知道jar位置在哪里 ,可以這樣搜搜索: find   /   -name  admin.html

注意:不要把jar上傳到這里:/var/lib/solr/tomcat-deployment/webapps/solr/WEB-INF/lib

這是tomcat部署的時候的位置,重啟后重新從上面兩個路徑的jar拷貝到/var/lib/solr/tomcat-deployment/webapps/solr/WEB-INF/lib這里,如果你上傳到這里,重啟solr,jar會消失

我們把IKAnalyzer.cfg.xml、stopword.dic拷貝到需要使用分詞器的core的conf下面,和core的schema.xml文件一個目錄。
修改core的schema.xml:

  1. <fieldType name="text_ik" class="solr.TextField">   

  2.         <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  

  3.         <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>  

  4.     </fieldType>


配置測試字段:

  1. <field name="quesContent" type="text_ik" />

三:測試配置
CDH如何添加solr中文分詞

以上是“CDH如何添加solr中文分詞”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學(xué)習(xí)更多知識,歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI