丰富您的数据编辑

您可以使用 enrich 处理器 在摄取过程中将现有索引中的数据添加到传入文档中。

例如,您可以使用 enrich 处理器来

  • 根据已知 IP 地址识别 Web 服务或供应商
  • 根据产品 ID 将产品信息添加到零售订单中
  • 根据电子邮件地址补充联系信息
  • 根据用户坐标添加邮政编码

enrich 处理器的工作原理编辑

大多数处理器都是独立的,并且只更改传入文档中的*现有*数据。

ingest process

enrich 处理器将*新*数据添加到传入文档中,并且需要一些特殊的组件

enrich process
enrich 策略

一组配置选项,用于将正确的 enrich 数据添加到正确的传入文档中。

enrich 策略包含

  • 一个或多个*源索引*的列表,这些索引将 enrich 数据存储为文档
  • *策略类型*,它决定了处理器如何将 enrich 数据与传入文档匹配
  • 源索引中的*匹配字段*,用于匹配传入文档
  • *Enrich 字段*,包含您要添加到传入文档中的源索引中的 enrich 数据

在 enrich 处理器可以使用 enrich 策略之前,必须先执行该策略。执行时,enrich 策略使用策略源索引中的 enrich 数据创建一个简化的系统索引,称为*enrich 索引*。处理器使用此索引来匹配和丰富传入文档。

源索引
存储您要添加到传入文档中的 enrich 数据的索引。您可以像管理常规 Elasticsearch 索引一样创建和管理这些索引。您可以在一个 enrich 策略中使用多个源索引。您还可以在多个 enrich 策略中使用相同的源索引。
enrich 索引

绑定到特定 enrich 策略的特殊系统索引。

直接将传入文档与源索引中的文档匹配可能会很慢,并且会占用大量资源。为了加快速度,enrich 处理器使用 enrich 索引。

Enrich 索引包含来自源索引的 enrich 数据,但具有一些特殊属性以帮助简化它们

  • 它们是系统索引,这意味着它们由 Elasticsearch 内部管理,并且仅供 enrich 处理器和 ES|QL ENRICH 命令使用。
  • 它们始终以 .enrich-* 开头。
  • 它们是只读的,这意味着您不能直接更改它们。
  • 它们是强制合并的,以便快速检索。