New

The executive guide to generative AI

Read more

内置分析器参考

编辑

Elasticsearch 内置了各种各样的分析器,可以在任何索引中使用,无需进一步配置。

标准分析器
standard 分析器根据 Unicode 文本分割算法定义的词边界将文本分割成词项。它会删除大多数标点符号,将词项转换为小写,并支持删除停用词。
简单分析器
simple 分析器在遇到非字母字符时将文本分割成词项。它会将所有词项转换为小写。
空格分析器
whitespace 分析器在遇到任何空格字符时将文本分割成词项。它不会将词项转换为小写。
停用词分析器
stop 分析器类似于 simple 分析器,但还支持删除停用词。
关键词分析器
keyword 分析器是一个“noop”分析器,它接受给定的任何文本,并以单个词项的形式输出完全相同的文本。
模式分析器
pattern 分析器使用正则表达式将文本分割成词项。它支持小写转换和停用词。
语言分析器
Elasticsearch 提供了许多特定于语言的分析器,如 englishfrench
指纹分析器
fingerprint 分析器是一种特殊的分析器,用于创建可用于重复检测的指纹。

自定义分析器

编辑

如果您找不到适合您需求的分析器,您可以创建一个 custom 分析器,它结合了适当的字符过滤器分词器词元过滤器

On this page

Was this helpful?
Feedback