#
前言:首先有這樣一個需求,需要統(tǒng)計一篇10000字的文章,需要統(tǒng)計里面哪些詞出現(xiàn)的頻率比較高,這里面比較重要的是如何對文章中的一段話進(jìn)行分詞,例如“北京是×××的首都”,“北京”,“×××”,“中華”
下載 下載和elaticsearch對應(yīng)版本的ik分詞https://github.com/medcl/elasticsearch-analysis-ik/releases 安裝 elasticsea
簡介:當(dāng)前講解的 IK分詞器 包的 version 為1.8。一、下載zip包。 下面有附件鏈接【ik-安裝包.zip】,下載即可。