分片请求缓存设置
编辑分片请求缓存设置
编辑当针对一个索引或多个索引运行搜索请求时,每个涉及的分片会在本地执行搜索,并将本地结果返回给协调节点,协调节点会将这些分片级结果合并成一个“全局”结果集。
分片级请求缓存模块会在每个分片上缓存本地结果。这允许频繁使用(且可能耗时)的搜索请求几乎立即返回结果。请求缓存非常适合日志记录用例,在这种用例中,只有最新的索引处于活动更新状态 - 来自旧索引的结果将直接从缓存中提供。
缓存失效
编辑缓存是智能的,它保持与未缓存搜索相同的近实时承诺。
当分片刷新以获取对文档的更改或当您更新映射时,缓存的结果会自动失效。换句话说,您始终会从缓存中获得与未缓存搜索请求相同的结果。
刷新间隔越长,即使文档发生更改,缓存的条目保持有效的时间也越长。如果缓存已满,则最近最少使用的缓存键将被驱逐。
可以使用 clear-cache
API 手动使缓存过期
resp = client.indices.clear_cache( index="my-index-000001,my-index-000002", request=True, ) print(resp)
response = client.indices.clear_cache( index: 'my-index-000001,my-index-000002', request: true ) puts response
const response = await client.indices.clearCache({ index: "my-index-000001,my-index-000002", request: "true", }); console.log(response);
POST /my-index-000001,my-index-000002/_cache/clear?request=true
启用和禁用缓存
编辑默认情况下启用缓存,但在创建新索引时可以禁用,如下所示
resp = client.indices.create( index="my-index-000001", settings={ "index.requests.cache.enable": False }, ) print(resp)
response = client.indices.create( index: 'my-index-000001', body: { settings: { 'index.requests.cache.enable' => false } } ) puts response
const response = await client.indices.create({ index: "my-index-000001", settings: { "index.requests.cache.enable": false, }, }); console.log(response);
PUT /my-index-000001 { "settings": { "index.requests.cache.enable": false } }
也可以使用 update-settings
API 在现有索引上动态启用或禁用它
resp = client.indices.put_settings( index="my-index-000001", settings={ "index.requests.cache.enable": True }, ) print(resp)
response = client.indices.put_settings( index: 'my-index-000001', body: { 'index.requests.cache.enable' => true } ) puts response
const response = await client.indices.putSettings({ index: "my-index-000001", settings: { "index.requests.cache.enable": true, }, }); console.log(response);
PUT /my-index-000001/_settings { "index.requests.cache.enable": true }
每个请求启用和禁用缓存
编辑request_cache
查询字符串参数可用于在每个请求的基础上启用或禁用缓存。如果设置,它会覆盖索引级设置
resp = client.search( index="my-index-000001", request_cache=True, size=0, aggs={ "popular_colors": { "terms": { "field": "colors" } } }, ) print(resp)
response = client.search( index: 'my-index-000001', request_cache: true, body: { size: 0, aggregations: { popular_colors: { terms: { field: 'colors' } } } } ) puts response
const response = await client.search({ index: "my-index-000001", request_cache: "true", size: 0, aggs: { popular_colors: { terms: { field: "colors", }, }, }, }); console.log(response);
GET /my-index-000001/_search?request_cache=true { "size": 0, "aggs": { "popular_colors": { "terms": { "field": "colors" } } } }
即使在索引设置中启用了请求缓存,size
大于 0 的请求也不会被缓存。要缓存这些请求,您需要使用此处详述的查询字符串参数。
缓存键
编辑整个 JSON 主体的哈希值用作缓存键。这意味着,如果 JSON 发生更改(例如,如果键以不同的顺序输出),则不会识别缓存键。
大多数 JSON 库都支持规范模式,该模式确保 JSON 键始终以相同的顺序发出。可以在应用程序中使用此规范模式来确保始终以相同的方式序列化请求。
缓存设置
编辑缓存在节点级别进行管理,默认最大大小为堆的 1%
。这可以在 config/elasticsearch.yml
文件中使用以下内容进行更改
indices.requests.cache.size: 2%
此外,您可以使用 indices.requests.cache.expire
设置来指定缓存结果的 TTL,但应该没有理由这样做。请记住,当索引刷新时,过时的结果会自动失效。提供此设置仅是为了完整起见。
监控缓存使用情况
编辑可以使用 indices-stats
API 按索引查看缓存大小(以字节为单位)和逐出次数
resp = client.indices.stats( metric="request_cache", human=True, ) print(resp)
response = client.indices.stats( metric: 'request_cache', human: true ) puts response
const response = await client.indices.stats({ metric: "request_cache", human: "true", }); console.log(response);
GET /_stats/request_cache?human
或者使用 nodes-stats
API 按节点查看
resp = client.nodes.stats( metric="indices", index_metric="request_cache", human=True, ) print(resp)
response = client.nodes.stats( metric: 'indices', index_metric: 'request_cache', human: true ) puts response
const response = await client.nodes.stats({ metric: "indices", index_metric: "request_cache", human: "true", }); console.log(response);
GET /_nodes/stats/indices/request_cache?human