示例:基于地理位置丰富数据

编辑

示例:基于地理位置丰富数据编辑

geo_match enrich 策略 使用 geo_shape 查询,根据地理位置将 enrich 数据匹配到传入文档。

以下示例创建一个 geo_match enrich 策略,该策略根据一组坐标将邮政编码添加到传入文档中。然后,它将 geo_match enrich 策略添加到摄取管道中的处理器。

使用 创建索引 API 创建包含至少一个 geo_shape 字段的源索引。

response = client.indices.create(
  index: 'postal_codes',
  body: {
    mappings: {
      properties: {
        location: {
          type: 'geo_shape'
        },
        postal_code: {
          type: 'keyword'
        }
      }
    }
  }
)
puts response
PUT /postal_codes
{
  "mappings": {
    "properties": {
      "location": {
        "type": "geo_shape"
      },
      "postal_code": {
        "type": "keyword"
      }
    }
  }
}

使用 索引 API 将 enrich 数据索引到此源索引。

response = client.index(
  index: 'postal_codes',
  id: 1,
  refresh: 'wait_for',
  body: {
    location: {
      type: 'envelope',
      coordinates: [
        [
          13,
          53
        ],
        [
          14,
          52
        ]
      ]
    },
    postal_code: '96598'
  }
)
puts response
PUT /postal_codes/_doc/1?refresh=wait_for
{
  "location": {
    "type": "envelope",
    "coordinates": [ [ 13.0, 53.0 ], [ 14.0, 52.0 ] ]
  },
  "postal_code": "96598"
}

使用 创建 enrich 策略 API 创建具有 geo_match 策略类型的 enrich 策略。此策略必须包含

  • 一个或多个源索引
  • 一个 match_field,即源索引中用于匹配传入文档的 geo_shape 字段
  • 要附加到传入文档的源索引中的 Enrich 字段
response = client.enrich.put_policy(
  name: 'postal_policy',
  body: {
    geo_match: {
      indices: 'postal_codes',
      match_field: 'location',
      enrich_fields: [
        'location',
        'postal_code'
      ]
    }
  }
)
puts response
PUT /_enrich/policy/postal_policy
{
  "geo_match": {
    "indices": "postal_codes",
    "match_field": "location",
    "enrich_fields": [ "location", "postal_code" ]
  }
}

使用 执行 enrich 策略 API 为策略创建 enrich 索引。

POST /_enrich/policy/postal_policy/_execute?wait_for_completion=false

使用 创建或更新管道 API 创建摄取管道。在管道中,添加一个包含以下内容的 enrich 处理器

  • 您的 enrich 策略。
  • 用于匹配 enrich 索引中文档的地理形状的传入文档的 field
  • 用于存储传入文档的附加 enrich 数据的 target_field。此字段包含 enrich 策略中指定的 match_fieldenrich_fields
  • shape_relation,它指示处理器如何将传入文档中的地理形状与 enrich 索引中文档中的地理形状进行匹配。有关有效选项和更多信息,请参阅 空间关系
PUT /_ingest/pipeline/postal_lookup
{
  "processors": [
    {
      "enrich": {
        "description": "Add 'geo_data' based on 'geo_location'",
        "policy_name": "postal_policy",
        "field": "geo_location",
        "target_field": "geo_data",
        "shape_relation": "INTERSECTS"
      }
    }
  ]
}

使用摄取管道索引文档。传入文档应包含 enrich 处理器中指定的 field

PUT /users/_doc/0?pipeline=postal_lookup
{
  "first_name": "Mardy",
  "last_name": "Brown",
  "geo_location": "POINT (13.5 52.5)"
}

要验证 enrich 处理器是否匹配并附加了相应的字段数据,请使用 获取 API 查看已索引的文档。

response = client.get(
  index: 'users',
  id: 0
)
puts response
GET /users/_doc/0

API 返回以下响应

{
  "found": true,
  "_index": "users",
  "_id": "0",
  "_version": 1,
  "_seq_no": 55,
  "_primary_term": 1,
  "_source": {
    "geo_data": {
      "location": {
        "type": "envelope",
        "coordinates": [[13.0, 53.0], [14.0, 52.0]]
      },
      "postal_code": "96598"
    },
    "first_name": "Mardy",
    "last_name": "Brown",
    "geo_location": "POINT (13.5 52.5)"
  }
}