配置内部队列编辑

Metricbeat 使用一个内部队列来存储事件,然后再发布它们。队列负责缓冲和将事件合并成批次,以便输出端可以消费。输出端将使用批量操作在一次事务中发送一批事件。

可以通过在 metricbeat.yml 配置文件中的 queue 部分设置选项,或者在输出端的 queue 部分设置选项来配置内部队列的类型和行为。只能配置一种队列类型。

此示例配置将内存队列设置为缓冲最多 4096 个事件

queue.mem:
  events: 4096

配置内存队列编辑

内存队列将所有事件保留在内存中。

内存队列等待输出端确认或丢弃事件。如果队列已满,则不能将新事件插入内存队列。只有在收到输出端的信号后,队列才会释放空间以接受更多事件。

内存队列由参数 flush.min_eventsflush.timeout 控制。 flush.min_events 限制了可以包含在一个批次中的事件数量,而 flush.timeout 指定了队列应等待多长时间才能完全填充事件请求。如果输出端支持 bulk_max_size 参数,则最大批次大小将是 bulk_max_sizeflush.min_events 中较小的值。

flush.min_events 是一个遗留参数,新的配置应该优先使用 bulk_max_size 来控制批次大小。从 8.13 版本开始,使用 flush.min_events 而不是 bulk_max_size 来限制批次大小从来没有性能优势。

在同步模式下,一旦事件可用,事件请求就会立即被填充,即使没有足够的事件来填充请求的批次。当必须将延迟降到最低时,这很有用。要使用同步模式,请将 flush.timeout 设置为 0。

为了向后兼容,也可以通过将 flush.min_events 设置为 0 或 1 来激活同步模式。在这种情况下,批次大小将限制为队列容量的一半。

在异步模式下,事件请求将等待指定的超时时间,以尝试完全填充请求的批次。如果超时时间到期,队列将返回一个包含所有可用事件的局部批次。要使用异步模式,请将 flush.timeout 设置为一个正持续时间,例如 5s

此示例配置在有足够事件来填充输出端的请求时(通常由 bulk_max_size 控制,并由 flush.min_events 限制为最多 512 个事件),或者当事件已等待 5 秒但未填充请求的大小,将事件转发到输出端。

queue.mem:
  events: 4096
  flush.min_events: 512
  flush.timeout: 5s

配置选项编辑

可以在 metricbeat.yml 配置文件中的 queue.mem 部分指定以下选项。

events编辑

队列可以存储的事件数。

默认值为 3200 个事件。

flush.min_events编辑

如果大于 1,则指定每个批次的事件最大数量。在这种情况下,输出端必须等待队列累积请求数量的事件,或者等待 flush.timeout 到期,才能发布。

如果为 0 或 1,则将每个批次的事件最大数量设置为队列大小的一半,并将队列设置为同步模式(等效于 flush.timeout 为 0)。

默认值为 1600。

flush.timeout编辑

输出端事件请求被满足的最大等待时间。如果设置为 0s,则立即返回事件。

默认值为 10s。

配置磁盘队列编辑

磁盘队列将待处理事件存储在磁盘上,而不是主内存中。这允许 Beats 队列比内存队列所能容纳的更多事件,并在 Beat 或设备重新启动时保存事件。这种增强的可靠性伴随着性能折衷,因为每个传入事件都必须写入并从设备的磁盘读取。但是,对于磁盘不是主要瓶颈的设置,磁盘队列提供了一种简单且开销相对较低的方式,为传入事件数据添加一层鲁棒性。

要使用默认设置启用磁盘队列,请指定一个最大大小。

queue.disk:
  max_size: 10GB

队列将使用磁盘上指定的最大大小。它只会使用所需的空间。例如,如果队列只存储 1GB 的事件,那么无论最大值有多高,它只会在磁盘上占用 1GB 的空间。队列数据在成功发送到输出端后会从磁盘中删除。

配置选项编辑

可以在 metricbeat.yml 配置文件中的 queue.disk 部分指定以下选项。

path编辑

磁盘队列应存储其数据文件的目录的路径。如果目录不存在,则在启动时创建。

默认值为 "${path.data}/diskqueue"

max_size(必需)编辑

队列应在磁盘上使用的最大大小。超过此最大值的事件将暂停其输入或被丢弃,具体取决于输入的配置。

0 表示不强制执行最大大小,队列可以增长到磁盘上的可用空间量。应谨慎使用此值,因为完全填充系统的磁盘可能会使其无法操作。最好只在专用数据或备份分区上使用此设置,这样就不会干扰 Metricbeat 或主机系统中的其他程序。

默认值为 10GB

segment_size编辑

添加到队列中的数据存储在段文件中。每个段包含一些等待发送到输出端的事件,并在所有事件都发送后被删除。默认情况下,段大小限制为最大队列大小的 1/10。使用较小的尺寸意味着队列将使用更多数据文件,但它们将更快地删除。使用较大的尺寸意味着一些数据需要更长时间才能删除,但队列将使用更少的辅助文件。通常,将此值保持不变就可以了。

默认值为 max_size / 10

read_ahead编辑

在等待输出端请求事件时,应该从磁盘读取到内存中的事件数。如果你发现输出端变慢,因为它们不能一次读取那么多事件,那么向上调整此设置可能会有所帮助,但会增加内存使用量。

默认值为 512

write_ahead编辑

队列应接受并存储在内存中的事件数,同时等待将它们写入磁盘。如果你发现队列的内存使用量过高,因为事件等待写入磁盘的时间过长,那么向下调整此设置可能会有所帮助,但会降低事件吞吐量。另一方面,如果输入端正在等待或丢弃事件,因为它们产生的速度快于磁盘可以处理的速度,那么向上调整此设置可能会有所帮助,但会增加内存使用量。

默认值为 2048

retry_interval编辑

某些磁盘错误可能会阻止队列的操作,例如写入数据目录的权限错误,或写入事件时的磁盘已满错误。在这种情况下,队列会报告错误,并在暂停 retry_interval 中指定的时间后重试。

默认值为 1s(一秒)。

max_retry_interval编辑

当多次连续出现写入磁盘的错误时,队列会将重试间隔增加 2 倍,直到达到 max_retry_interval 的最大值。如果担心记录过多的错误或在目标磁盘长时间不可用时使主机系统过载,请增加此值。

默认值为 30s(30 秒)。