智能中文分析插件编辑

智能中文分析插件将 Lucene 的智能中文分析模块集成到 Elasticsearch 中。

它提供了一个用于中文或混合中英文文本的分析器。该分析器使用概率知识来找到简体中文文本的最佳词语切分。文本首先被分解成句子,然后每个句子被切分成词语。

安装编辑

可以使用插件管理器安装此插件

sudo bin/elasticsearch-plugin install analysis-smartcn

必须在集群中的每个节点上安装此插件,并且每个节点在安装后都必须重新启动。

您可以从 https://artifacts.elastic.co/downloads/elasticsearch-plugins/analysis-smartcn/analysis-smartcn-8.14.2.zip 下载此插件以进行 离线安装。要验证 .zip 文件,请使用 SHA 哈希ASC 密钥

移除编辑

可以使用以下命令移除插件

sudo bin/elasticsearch-plugin remove analysis-smartcn

在移除插件之前,必须停止节点。

smartcn 分词器和 token 过滤器编辑

该插件提供了 smartcn 分析器、smartcn_tokenizer 分词器和 smartcn_stop token 过滤器,它们不可配置。

smartcn_word token 过滤器和 smartcn_sentence 已被弃用。