内置分析器参考编辑

Elasticsearch 附带了各种内置分析器,这些分析器可以在任何索引中使用,无需进一步配置。

标准分析器
standard 分析器根据 Unicode 文本分段算法定义的词边界将文本划分为词项。它会删除大多数标点符号,将词项转换为小写,并支持删除停用词。
简单分析器
simple 分析器在遇到非字母字符时将文本划分为词项。它会将所有词项转换为小写。
空格分析器
whitespace 分析器在遇到任何空格字符时将文本划分为词项。它不会将词项转换为小写。
停用词分析器
stop 分析器类似于 simple 分析器,但还支持删除停用词。
关键字分析器
keyword 分析器是一个“无操作”分析器,它接受任何给定的文本,并将其作为单个词项输出。
模式分析器
pattern 分析器使用正则表达式将文本拆分为词项。它支持转换为小写和停用词。
语言分析器
Elasticsearch 提供了许多特定于语言的分析器,例如 englishfrench
指纹分析器
fingerprint 分析器是一个专门的分析器,它创建指纹,可用于重复项检测。

自定义分析器编辑

如果您找不到适合您需求的分析器,您可以创建一个 custom 分析器,它将结合适当的 字符过滤器分词器词项过滤器