溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何在Elasticsearch中離線安裝IK分詞器?

發(fā)布時間:2020-05-28 14:02:10 來源:億速云 閱讀:1570 作者:鴿子 欄目:開發(fā)技術

Elasticsearch自帶的分詞器對中文分詞不是很友好,所以我們下載開源的IK分詞器來解決這個問題。首先進入到plugins目錄中下載分詞器,下載完成后然后解壓,再重啟es即可。具體步驟如下: 注意:elasticsearch的版本和ik分詞器的版本需要保持一致,不然在重啟的時候會失敗??梢栽谶@查看所有版本,選擇合適自己版本的右鍵復制鏈接地址即可。在該鏈接中找到符合自己版本的:https://github.com/medcl/elasticsearch-analysis-ik/releases

docker exec -it elasticsearch /bin/bash
cd /usr/share/elasticsearch/plugins/ 
elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.5.1/elasticsearch-analysis-ik-7.5.1.zip
exit 
docker restart elasticsearch 

由于通過上述方式安裝由于網(wǎng)絡問題可能實現(xiàn)不了,所以可以通過離線安裝

通過https://github.com/medcl/elasticsearch-analysis-ik/releases下載對應版本安裝包
在es的plugins文件下(/usr/share/elasticsearch/plugins/)創(chuàng)建ik文件夾
cd /usr/share/elasticsearch/plugins/
mkdir ik
將下載好的安裝包拷貝在這個文件夾下,同時減壓即可

注意:安裝es的ik分詞器需要安裝jdk

測試:

POST http://localhost:9200/_analyze?pretty=true
{
  "analyzer": "ik_max_word",
  "text": "中國人民的兒子"
}

結(jié)果:

{
  "tokens" : [
    {
      "token" : "中國人民",
      "start_offset" : 0,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 0
    },
    {
      "token" : "中國人",
      "start_offset" : 0,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 1
    },
    {
      "token" : "中國",
      "start_offset" : 0,
      "end_offset" : 2,
      "type" : "CN_WORD",
      "position" : 2
    },
    {
      "token" : "國人",
      "start_offset" : 1,
      "end_offset" : 3,
      "type" : "CN_WORD",
      "position" : 3
    },
    {
      "token" : "人民",
      "start_offset" : 2,
      "end_offset" : 4,
      "type" : "CN_WORD",
      "position" : 4
    },
    {
      "token" : "的",
      "start_offset" : 4,
      "end_offset" : 5,
      "type" : "CN_CHAR",
      "position" : 5
    },
    {
      "token" : "兒子",
      "start_offset" : 5,
      "end_offset" : 7,
      "type" : "CN_WORD",
      "position" : 6
    }
  ]
}

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI