分片请求缓存设置

编辑

当针对一个索引或多个索引运行搜索请求时,每个涉及的分片会在本地执行搜索,并将本地结果返回给协调节点,协调节点会将这些分片级结果合并成一个“全局”结果集。

分片级请求缓存模块会在每个分片上缓存本地结果。这允许频繁使用(且可能耗时)的搜索请求几乎立即返回结果。请求缓存非常适合日志记录用例,在这种用例中,只有最新的索引处于活动更新状态 - 来自旧索引的结果将直接从缓存中提供。

默认情况下,请求缓存只会缓存 size=0 的搜索请求的结果,因此它不会缓存 hits,但会缓存 hits.total聚合建议

大多数使用 now 的查询(请参阅 日期数学)都不能被缓存。

使用非确定性 API 调用的脚本查询(例如 Math.random()new Date())不会被缓存。

缓存失效

编辑

缓存是智能的,它保持与未缓存搜索相同的近实时承诺。

当分片刷新以获取对文档的更改或当您更新映射时,缓存的结果会自动失效。换句话说,您始终会从缓存中获得与未缓存搜索请求相同的结果。

刷新间隔越长,即使文档发生更改,缓存的条目保持有效的时间也越长。如果缓存已满,则最近最少使用的缓存键将被驱逐。

可以使用 clear-cache API 手动使缓存过期

resp = client.indices.clear_cache(
    index="my-index-000001,my-index-000002",
    request=True,
)
print(resp)
response = client.indices.clear_cache(
  index: 'my-index-000001,my-index-000002',
  request: true
)
puts response
const response = await client.indices.clearCache({
  index: "my-index-000001,my-index-000002",
  request: "true",
});
console.log(response);
POST /my-index-000001,my-index-000002/_cache/clear?request=true

启用和禁用缓存

编辑

默认情况下启用缓存,但在创建新索引时可以禁用,如下所示

resp = client.indices.create(
    index="my-index-000001",
    settings={
        "index.requests.cache.enable": False
    },
)
print(resp)
response = client.indices.create(
  index: 'my-index-000001',
  body: {
    settings: {
      'index.requests.cache.enable' => false
    }
  }
)
puts response
const response = await client.indices.create({
  index: "my-index-000001",
  settings: {
    "index.requests.cache.enable": false,
  },
});
console.log(response);
PUT /my-index-000001
{
  "settings": {
    "index.requests.cache.enable": false
  }
}

也可以使用 update-settings API 在现有索引上动态启用或禁用它

resp = client.indices.put_settings(
    index="my-index-000001",
    settings={
        "index.requests.cache.enable": True
    },
)
print(resp)
response = client.indices.put_settings(
  index: 'my-index-000001',
  body: {
    'index.requests.cache.enable' => true
  }
)
puts response
const response = await client.indices.putSettings({
  index: "my-index-000001",
  settings: {
    "index.requests.cache.enable": true,
  },
});
console.log(response);
PUT /my-index-000001/_settings
{ "index.requests.cache.enable": true }

每个请求启用和禁用缓存

编辑

request_cache 查询字符串参数可用于在每个请求的基础上启用或禁用缓存。如果设置,它会覆盖索引级设置

resp = client.search(
    index="my-index-000001",
    request_cache=True,
    size=0,
    aggs={
        "popular_colors": {
            "terms": {
                "field": "colors"
            }
        }
    },
)
print(resp)
response = client.search(
  index: 'my-index-000001',
  request_cache: true,
  body: {
    size: 0,
    aggregations: {
      popular_colors: {
        terms: {
          field: 'colors'
        }
      }
    }
  }
)
puts response
const response = await client.search({
  index: "my-index-000001",
  request_cache: "true",
  size: 0,
  aggs: {
    popular_colors: {
      terms: {
        field: "colors",
      },
    },
  },
});
console.log(response);
GET /my-index-000001/_search?request_cache=true
{
  "size": 0,
  "aggs": {
    "popular_colors": {
      "terms": {
        "field": "colors"
      }
    }
  }
}

即使在索引设置中启用了请求缓存,size 大于 0 的请求也不会被缓存。要缓存这些请求,您需要使用此处详述的查询字符串参数。

缓存键

编辑

整个 JSON 主体的哈希值用作缓存键。这意味着,如果 JSON 发生更改(例如,如果键以不同的顺序输出),则不会识别缓存键。

大多数 JSON 库都支持规范模式,该模式确保 JSON 键始终以相同的顺序发出。可以在应用程序中使用此规范模式来确保始终以相同的方式序列化请求。

缓存设置

编辑

缓存在节点级别进行管理,默认最大大小为堆的 1%。这可以在 config/elasticsearch.yml 文件中使用以下内容进行更改

indices.requests.cache.size: 2%

此外,您可以使用 indices.requests.cache.expire 设置来指定缓存结果的 TTL,但应该没有理由这样做。请记住,当索引刷新时,过时的结果会自动失效。提供此设置仅是为了完整起见。

监控缓存使用情况

编辑

可以使用 indices-stats API 按索引查看缓存大小(以字节为单位)和逐出次数

resp = client.indices.stats(
    metric="request_cache",
    human=True,
)
print(resp)
response = client.indices.stats(
  metric: 'request_cache',
  human: true
)
puts response
const response = await client.indices.stats({
  metric: "request_cache",
  human: "true",
});
console.log(response);
GET /_stats/request_cache?human

或者使用 nodes-stats API 按节点查看

resp = client.nodes.stats(
    metric="indices",
    index_metric="request_cache",
    human=True,
)
print(resp)
response = client.nodes.stats(
  metric: 'indices',
  index_metric: 'request_cache',
  human: true
)
puts response
const response = await client.nodes.stats({
  metric: "indices",
  index_metric: "request_cache",
  human: "true",
});
console.log(response);
GET /_nodes/stats/indices/request_cache?human