term_vector编辑

词项向量包含有关由 分析 过程产生的词项的信息,包括

  • 词项列表。
  • 每个词项的位置(或顺序)。
  • 将词项映射到其在原始字符串中的来源的开始和结束字符偏移量。
  • 有效负载(如果可用)——与每个词项位置关联的用户定义二进制数据。

这些词项向量可以被存储,以便可以为特定文档检索它们。

term_vector 设置接受

no

不存储任何词项向量。(默认)

yes

只存储字段中的词项。

with_positions

存储词项和位置。

with_offsets

存储词项和字符偏移量。

with_positions_offsets

存储词项、位置和字符偏移量。

with_positions_payloads

存储词项、位置和有效负载。

with_positions_offsets_payloads

存储词项、位置、偏移量和有效负载。

快速向量高亮器需要 with_positions_offsets词项向量 API 可以检索任何存储的内容。

设置 with_positions_offsets 将使字段索引的大小增加一倍。

response = client.indices.create(
  index: 'my-index-000001',
  body: {
    mappings: {
      properties: {
        text: {
          type: 'text',
          term_vector: 'with_positions_offsets'
        }
      }
    }
  }
)
puts response

response = client.index(
  index: 'my-index-000001',
  id: 1,
  body: {
    text: 'Quick brown fox'
  }
)
puts response

response = client.search(
  index: 'my-index-000001',
  body: {
    query: {
      match: {
        text: 'brown fox'
      }
    },
    highlight: {
      fields: {
        text: {}
      }
    }
  }
)
puts response
PUT my-index-000001
{
  "mappings": {
    "properties": {
      "text": {
        "type":        "text",
        "term_vector": "with_positions_offsets"
      }
    }
  }
}

PUT my-index-000001/_doc/1
{
  "text": "Quick brown fox"
}

GET my-index-000001/_search
{
  "query": {
    "match": {
      "text": "brown fox"
    }
  },
  "highlight": {
    "fields": {
      "text": {} 
    }
  }
}

快速向量高亮器将默认用于 text 字段,因为词项向量已启用。