内置分析器参考

编辑

Elasticsearch 内置了各种各样的分析器,可以在任何索引中使用,无需进一步配置。

标准分析器
standard 分析器根据 Unicode 文本分割算法定义的词边界将文本分割成词项。它会删除大多数标点符号,将词项转换为小写,并支持删除停用词。
简单分析器
simple 分析器在遇到非字母字符时将文本分割成词项。它会将所有词项转换为小写。
空格分析器
whitespace 分析器在遇到任何空格字符时将文本分割成词项。它不会将词项转换为小写。
停用词分析器
stop 分析器类似于 simple 分析器,但还支持删除停用词。
关键词分析器
keyword 分析器是一个“noop”分析器,它接受给定的任何文本,并以单个词项的形式输出完全相同的文本。
模式分析器
pattern 分析器使用正则表达式将文本分割成词项。它支持小写转换和停用词。
语言分析器
Elasticsearch 提供了许多特定于语言的分析器,如 englishfrench
指纹分析器
fingerprint 分析器是一种特殊的分析器,用于创建可用于重复检测的指纹。

自定义分析器

编辑

如果您找不到适合您需求的分析器,您可以创建一个 custom 分析器,它结合了适当的字符过滤器分词器词元过滤器