智能中文分析插件
编辑智能中文分析插件编辑
智能中文分析插件将 Lucene 的智能中文分析模块集成到 Elasticsearch 中。
它为中文或中英文混合文本提供了一个分析器。此分析器使用概率知识来找到简体中文文本的最佳分词。文本首先被分成句子,然后每个句子被分成单词。
安装编辑
可以使用插件管理器安装此插件
sudo bin/elasticsearch-plugin install analysis-smartcn
该插件必须安装在集群中的每个节点上,并且每个节点在安装后必须重新启动。
您可以从 https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-smartcn/analysis-smartcn-8.14.3.zip 下载此插件进行 离线安装。要验证 .zip
文件,请使用 SHA 哈希值 或 ASC 密钥。
移除编辑
可以使用以下命令移除该插件
sudo bin/elasticsearch-plugin remove analysis-smartcn
在移除插件之前,必须停止节点。
smartcn
分词器和字符过滤器编辑
该插件提供了 smartcn
分析器、smartcn_tokenizer
分词器和 smartcn_stop
字符过滤器,它们都不可配置。
smartcn_word
字符过滤器和 smartcn_sentence
已被弃用。