Elasticsearch 中的数据流生命周期设置

编辑

Elasticsearch 中的数据流生命周期设置

编辑

以下是配置数据流生命周期 可用的设置。

集群级别设置

编辑
data_streams.lifecycle.retention.max
(动态时间单位值) 将应用于由数据流生命周期管理的所有用户数据流的最大保留期。最大保留期也将覆盖配置的保留期超过最大保留期的 数据流的保留期。它应该大于10s
data_streams.lifecycle.retention.default
(动态时间单位值) 将应用于由数据流生命周期管理且未配置保留期 的所有用户数据流的保留期。它应该大于10s且小于或等于data_streams.lifecycle.retention.max
data_streams.lifecycle.poll_interval
(动态时间单位值) Elasticsearch 检查所有具有内置生命周期的数据流的下一个操作的频率。默认为5m
cluster.lifecycle.default.rollover

(动态,字符串) 此属性接受键值对格式的字符串,并配置触发数据流滚动 的条件(前提是已配置lifecycle)。此属性是实现细节,可能随时更改。当前,它默认为max_age=auto,max_primary_shard_size=50gb,min_docs=1,max_primary_shard_docs=200000000,这意味着如果满足以下任何条件,您的数据流将滚动:

  • 任何主分片的大小达到 50GB;
  • 或任何主分片包含 200,000,000 个文档;
  • 或索引达到某个年龄(取决于数据流的保留时间);
  • 并且至少包含一个文档。
data_streams.lifecycle.target.merge.policy.merge_factor
(动态,整数) 数据流生命周期通过更新目标后端索引的 lucene 合并策略因子来实现尾部合并。合并因子既是应合并在一起的段数,也是我们期望在给定层级上找到的最大段数。此设置控制数据流生命周期 在目标索引上配置的值。默认为16。该值将在目标索引上的index.merge.policy.merge_factor索引设置下可见。
data_streams.lifecycle.target.merge.policy.floor_segment
(动态) 数据流生命周期通过更新目标后端索引的 lucene 合并策略基准段来实现尾部合并。此基准段大小可防止索引具有许多非常小的段的冗长尾部。此设置控制数据流生命周期 在目标索引上配置的值。默认为100MB
data_streams.lifecycle.signalling.error_retry_interval
(动态,整数) 表示数据流生命周期必须为错误步骤中的索引执行的重试次数,以指示索引未进展(即它卡在错误步骤中)。当前的信号机制是error级别的日志语句,但是,将来可以扩展信号机制。默认为 10 次重试。

索引级别设置

编辑

以下索引级别设置通常配置在数据流的后端索引上。

index.lifecycle.prefer_ilm
(动态,布尔值) 此设置确定如果且仅当后端索引具有索引生命周期管理 (ILM)策略并且数据流也具有内置生命周期时,哪个功能正在管理数据流的后端索引。当true时,此索引由 ILM 管理;当false时,后端索引由数据流生命周期管理。默认为true
index.lifecycle.origination_date
(动态,长整数) 如果指定,则此时间戳用于计算此后端索引滚动 后后端索引生成的年龄。生成年龄用于确定数据保留,因此,如果您创建包含较旧数据的后端索引并希望确保根据数据的原始时间戳而不是其被索引的时间戳应用保留期或生命周期的其他部分,则可以使用此设置。指定为以毫秒为单位的 Unix 时间戳值。