配置内部队列

编辑

Heartbeat 使用内部队列来存储事件,然后再发布它们。该队列负责缓冲并将事件组合成批次,以便输出可以使用。输出将使用批量操作来在一个事务中发送一批事件。

你可以通过在 heartbeat.yml 配置文件的 queue 部分设置选项,或者通过在输出的 queue 部分设置选项来配置内部队列的类型和行为。只能配置一种队列类型。

此示例配置将内存队列设置为缓冲最多 4096 个事件

queue.mem:
  events: 4096

配置内存队列

编辑

内存队列将所有事件保存在内存中。

内存队列等待输出确认或丢弃事件。如果队列已满,则无法将新事件插入内存队列。只有在收到输出的信号后,队列才会释放空间以接受更多事件。

内存队列由参数 flush.min_eventsflush.timeout 控制。flush.min_events 限制了单个批次中可以包含的事件数量,而 flush.timeout 指定队列应等待多长时间才能完全填充事件请求。如果输出支持 bulk_max_size 参数,则最大批次大小将是 bulk_max_sizeflush.min_events 中较小的值。

flush.min_events 是一个遗留参数,新的配置应首选使用 bulk_max_size 来控制批次大小。从 8.13 版本开始,使用 bulk_max_size 而不是 flush.min_events 来限制批次大小在性能上没有任何优势。

在同步模式下,只要有事件可用,就会立即填充事件请求,即使没有足够的事件来填充请求的批次。当必须最小化延迟时,这非常有用。要使用同步模式,请将 flush.timeout 设置为 0。

为了向后兼容,还可以通过将 flush.min_events 设置为 0 或 1 来激活同步模式。在这种情况下,批次大小将限制为队列容量的 1/2。

在异步模式下,事件请求将等待到指定的超时时间,以尝试完全填充请求的批次。如果超时到期,队列将返回包含所有可用事件的部分批次。要使用异步模式,请将 flush.timeout 设置为正持续时间,例如 5s

此示例配置在有足够的事件来填充输出的请求(通常由 bulk_max_size 控制,并且受 flush.min_events 限制为最多 512 个事件)时,或在事件已等待 5 秒而未填充请求的大小时,将事件转发到输出

queue.mem:
  events: 4096
  flush.min_events: 512
  flush.timeout: 5s

配置选项

编辑

你可以在 heartbeat.yml 配置文件的 queue.mem 部分中指定以下选项

events
编辑

队列可以存储的事件数。

默认值为 3200 个事件。

flush.min_events
编辑

如果大于 1,则指定每个批次的最大事件数。在这种情况下,输出必须等待队列累积到请求的事件数,或等待 flush.timeout 过期后才能发布。

如果为 0 或 1,则将每个批次的最大事件数设置为队列大小的一半,并将队列设置为同步模式(等效于 flush.timeout 为 0)。

默认值为 1600。

flush.timeout
编辑

输出的事件请求的最大等待时间。如果设置为 0s,则立即返回事件。

默认值为 10 秒。

配置磁盘队列

编辑

磁盘队列将待处理的事件存储在磁盘上,而不是主内存中。这允许 Beats 队列比内存队列可能存储的更多事件,并在 Beats 或设备重新启动时保存事件。这种更高的可靠性带来了性能上的权衡,因为每个传入的事件都必须从设备的磁盘写入和读取。但是,对于磁盘不是主要瓶颈的设置,磁盘队列提供了一种简单且相对低开销的方式,可以为传入的事件数据添加一层健壮性。

要启用具有默认设置的磁盘队列,请指定最大大小

queue.disk:
  max_size: 10GB

该队列将在磁盘上使用最多指定的最大大小。它只会使用所需的空间。例如,如果队列仅存储 1GB 的事件,那么无论最大值有多高,它都只会在磁盘上占用 1GB。队列数据在成功发送到输出后会从磁盘中删除。

配置选项

编辑

你可以在 heartbeat.yml 配置文件的 queue.disk 部分中指定以下选项

path
编辑

磁盘队列应存储其数据文件的目录路径。如果该目录不存在,则会在启动时创建该目录。

默认值为 "${path.data}/diskqueue"

max_size (必需)
编辑

队列应在磁盘上使用的最大大小。超出此最大值的事件将暂停其输入或被丢弃,具体取决于输入的配置。

0 值表示不强制执行最大大小,并且队列可以增长到磁盘上的可用空间量。应谨慎使用此值,因为完全填充系统的主磁盘可能会使其无法运行。最好仅在不会干扰 Heartbeat 或主机系统其余部分的专用数据或备份分区中使用此设置。

默认值为 10GB

segment_size
编辑

添加到队列的数据存储在段文件中。每个段包含一些等待发送到输出的事件,并在其所有事件发送后删除。默认情况下,段大小限制为最大队列大小的 1/10。使用较小的尺寸意味着队列将使用更多的数据文件,但它们将在使用后更快地删除。使用较大的尺寸意味着一些数据需要更长的时间才能删除,但队列将使用较少的辅助文件。通常,将此值保持不变即可。

默认值为 max_size / 10

read_ahead
编辑

在等待输出请求事件时,应从磁盘读取到内存中的事件数。如果你发现输出因无法一次读取尽可能多的事件而变慢,则向上调整此设置可能会有所帮助,但会增加内存使用量。

默认值为 512

write_ahead
编辑

在等待将事件写入磁盘时,队列应接受并存储在内存中的事件数。如果你发现队列的内存使用量过高,因为事件等待写入磁盘的时间太长,则向下调整此设置可能会有所帮助,但会降低事件吞吐量。另一方面,如果输入正在等待或丢弃事件,因为它们的生成速度快于磁盘的处理速度,则向上调整此设置可能会有所帮助,但会增加内存使用量。

默认值为 2048

retry_interval
编辑

某些磁盘错误可能会阻止队列的操作,例如写入数据目录的权限错误,或写入事件时磁盘已满错误。在这种情况下,队列会报告错误,并在暂停 retry_interval 中指定的时间后重试。

默认值为 1s (一秒)。

max_retry_interval
编辑

当连续多次写入磁盘时发生错误时,队列会将重试间隔增加 2 倍,直到最大 max_retry_interval。如果你担心记录过多错误或在目标磁盘长时间不可用时使主机系统过载,请增加此值。

默认值为 30s (三十秒)。