内置分析器参考
编辑内置分析器参考编辑
Elasticsearch 附带了各种内置分析器,这些分析器可以在任何索引中使用,无需进一步配置。
- 标准分析器
standard
分析器根据 Unicode 文本分段算法定义的词边界将文本划分为词项。它会删除大多数标点符号,将词项转换为小写,并支持删除停用词。- 简单分析器
simple
分析器在遇到非字母字符时将文本划分为词项。它会将所有词项转换为小写。- 空格分析器
whitespace
分析器在遇到任何空格字符时将文本划分为词项。它不会将词项转换为小写。- 停用词分析器
stop
分析器类似于simple
分析器,但还支持删除停用词。- 关键字分析器
keyword
分析器是一个“无操作”分析器,它接受任何给定的文本,并将其作为单个词项输出。- 模式分析器
pattern
分析器使用正则表达式将文本拆分为词项。它支持转换为小写和停用词。- 语言分析器
- Elasticsearch 提供了许多特定于语言的分析器,例如
english
或french
。 - 指纹分析器
fingerprint
分析器是一个专门的分析器,它创建指纹,可用于重复项检测。
自定义分析器编辑
如果您找不到适合您需求的分析器,您可以创建一个 custom
分析器,它将结合适当的 字符过滤器、分词器 和 词项过滤器。