智能中文分析插件
编辑智能中文分析插件
编辑智能中文分析插件将 Lucene 的智能中文分析模块集成到 Elasticsearch 中。
它提供了一个用于中文或中英文混合文本的分析器。该分析器使用概率知识来查找简体中文文本的最佳分词结果。文本首先被分解成句子,然后每个句子被分割成单词。
安装
编辑可以使用插件管理器安装此插件。
sudo bin/elasticsearch-plugin install analysis-smartcn
必须在集群中的每个节点上安装此插件,并且安装后必须重启每个节点。
您可以从此处下载此插件以进行离线安装:https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-smartcn/analysis-smartcn-8.16.0.zip。要验证.zip
文件,请使用SHA 哈希值或ASC 密钥。
卸载
编辑可以使用以下命令卸载插件。
sudo bin/elasticsearch-plugin remove analysis-smartcn
卸载插件前必须停止节点。
smartcn
分词器和分词过滤器
编辑该插件提供 smartcn
分析器、smartcn_tokenizer
分词器和 smartcn_stop
分词过滤器,这些都是不可配置的。
smartcn_word
分词过滤器和 smartcn_sentence
已弃用。