排名特征字段类型编辑

一个 rank_feature 字段可以索引数字,以便稍后在使用 rank_feature 查询的查询中提升文档。

response = client.indices.create(
  index: 'my-index-000001',
  body: {
    mappings: {
      properties: {
        pagerank: {
          type: 'rank_feature'
        },
        url_length: {
          type: 'rank_feature',
          positive_score_impact: false
        }
      }
    }
  }
)
puts response

response = client.index(
  index: 'my-index-000001',
  id: 1,
  body: {
    pagerank: 8,
    url_length: 22
  }
)
puts response

response = client.search(
  index: 'my-index-000001',
  body: {
    query: {
      rank_feature: {
        field: 'pagerank'
      }
    }
  }
)
puts response
PUT my-index-000001
{
  "mappings": {
    "properties": {
      "pagerank": {
        "type": "rank_feature" 
      },
      "url_length": {
        "type": "rank_feature",
        "positive_score_impact": false 
      }
    }
  }
}

PUT my-index-000001/_doc/1
{
  "pagerank": 8,
  "url_length": 22
}

GET my-index-000001/_search
{
  "query": {
    "rank_feature": {
      "field": "pagerank"
    }
  }
}

排名特征字段必须使用 rank_feature 字段类型

与分数负相关的排名特征需要声明它

rank_feature 字段仅支持单值字段和严格的正值。多值字段和负值将被拒绝。

rank_feature 字段不支持查询、排序或聚合。它们只能在 rank_feature 查询中使用。

rank_feature 字段仅保留 9 位有效位用于精度,这转化为大约 0.4% 的相对误差。

与分数负相关的排名特征应将 positive_score_impact 设置为 false(默认值为 true)。这将被 rank_feature 查询用于修改评分公式,使分数随着特征值的增加而减小,而不是增加。例如,在网络搜索中,URL 长度是一个常用的特征,它与分数负相关。