分析器的剖析
编辑分析器的剖析编辑
分析器(无论是内置的还是自定义的)都只是一个包含三个较低级别构建块的包:字符过滤器、分词器和词元过滤器。
内置的 分析器 将这些构建块预先打包成适合不同语言和文本类型的分析器。Elasticsearch 还公开了各个构建块,以便可以将它们组合起来定义新的 自定义
分析器。
字符过滤器编辑
字符过滤器接收原始文本作为字符流,并且可以通过添加、删除或更改字符来转换该流。例如,字符过滤器可用于将印度-阿拉伯数字 (٠١٢٣٤٥٦٧٨٩) 转换为其阿拉伯-拉丁语等效数字 (0123456789),或者从流中去除 <b>
等 HTML 元素。
分析器可以有 零个或多个 字符过滤器,它们按顺序应用。