您好,登錄后才能下訂單哦!
Elasticsearch自帶的分詞器對中文分詞不是很友好,所以我們下載開源的IK分詞器來解決這個問題。首先進入到plugins目錄中下載分詞器,下載完成后然后解壓,再重啟es即可。具體步驟如下: 注意:elasticsearch的版本和ik分詞器的版本需要保持一致,不然在重啟的時候會失敗??梢栽谶@查看所有版本,選擇合適自己版本的右鍵復制鏈接地址即可。在該鏈接中找到符合自己版本的:https://github.com/medcl/elasticsearch-analysis-ik/releases
docker exec -it elasticsearch /bin/bash
cd /usr/share/elasticsearch/plugins/
elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.5.1/elasticsearch-analysis-ik-7.5.1.zip
exit
docker restart elasticsearch
由于通過上述方式安裝由于網(wǎng)絡問題可能實現(xiàn)不了,所以可以通過離線安裝
通過https://github.com/medcl/elasticsearch-analysis-ik/releases下載對應版本安裝包
在es的plugins文件下(/usr/share/elasticsearch/plugins/)創(chuàng)建ik文件夾
cd /usr/share/elasticsearch/plugins/
mkdir ik
將下載好的安裝包拷貝在這個文件夾下,同時減壓即可
注意:安裝es的ik分詞器需要安裝jdk
測試:
POST http://localhost:9200/_analyze?pretty=true
{
"analyzer": "ik_max_word",
"text": "中國人民的兒子"
}
結(jié)果:
{
"tokens" : [
{
"token" : "中國人民",
"start_offset" : 0,
"end_offset" : 4,
"type" : "CN_WORD",
"position" : 0
},
{
"token" : "中國人",
"start_offset" : 0,
"end_offset" : 3,
"type" : "CN_WORD",
"position" : 1
},
{
"token" : "中國",
"start_offset" : 0,
"end_offset" : 2,
"type" : "CN_WORD",
"position" : 2
},
{
"token" : "國人",
"start_offset" : 1,
"end_offset" : 3,
"type" : "CN_WORD",
"position" : 3
},
{
"token" : "人民",
"start_offset" : 2,
"end_offset" : 4,
"type" : "CN_WORD",
"position" : 4
},
{
"token" : "的",
"start_offset" : 4,
"end_offset" : 5,
"type" : "CN_CHAR",
"position" : 5
},
{
"token" : "兒子",
"start_offset" : 5,
"end_offset" : 7,
"type" : "CN_WORD",
"position" : 6
}
]
}
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。