丰富你的数据

编辑

你可以使用 enrich 处理器 在 ingest 期间将现有索引中的数据添加到传入的文档中。

例如,你可以使用 enrich 处理器来

  • 根据已知的 IP 地址识别 Web 服务或供应商
  • 根据产品 ID 将产品信息添加到零售订单
  • 根据电子邮件地址补充联系信息
  • 根据用户坐标添加邮政编码

enrich 处理器的工作原理

编辑

大多数处理器都是自包含的,并且仅更改传入文档中的现有数据。

ingest process

enrich 处理器将新的数据添加到传入的文档中,并且需要一些特殊的组件

enrich process
enrich 策略

一组配置选项,用于将正确的 enrich 数据添加到正确的传入文档。

一个 enrich 策略包含

  • 一个或多个源索引列表,这些索引将 enrich 数据存储为文档
  • 策略类型,它决定处理器如何将 enrich 数据与传入文档匹配
  • 源索引中用于匹配传入文档的匹配字段
  • 包含你想要添加到传入文档中的源索引中的 enrich 数据的Enrich 字段

在与 enrich 处理器一起使用之前,必须执行 enrich 策略。执行后,enrich 策略使用策略的源索引中的 enrich 数据来创建一个精简的系统索引,称为enrich 索引。处理器使用此索引来匹配和丰富传入的文档。

源索引
一个索引,它存储你想要添加到传入文档中的 enrich 数据。你可以像管理常规 Elasticsearch 索引一样创建和管理这些索引。你可以在一个 enrich 策略中使用多个源索引。你还可以在多个 enrich 策略中使用相同的源索引。
enrich 索引

一个与特定 enrich 策略关联的特殊系统索引。

将传入文档直接与源索引中的文档匹配可能会很慢并且消耗大量资源。为了加快速度,enrich 处理器使用 enrich 索引。

Enrich 索引包含来自源索引的 enrich 数据,但有一些特殊属性可以帮助简化它们

  • 它们是系统索引,这意味着它们由 Elasticsearch 内部管理,仅用于 enrich 处理器和 ES|QL ENRICH 命令。
  • 它们总是以 .enrich-* 开头。
  • 它们是只读的,这意味着你无法直接更改它们。
  • 它们被强制合并以实现快速检索。