Logstash 输出
编辑Logstash 输出编辑
Logstash 输出使用内部协议通过 TCP 将事件直接发送到 Logstash。Logstash 提供对 Elastic Agent 收集的数据进行额外的解析、转换和路由。
兼容性: 此输出适用于所有兼容版本的 Logstash。请参阅 Elastic 支持矩阵。
此示例在 elastic-agent.yml
文件中配置了一个名为 default
的 Logstash 输出
要在 Logstash 中接收事件,您还需要创建一个 Logstash 配置管道。Logstash 配置管道侦听传入的 Elastic Agent 连接,处理接收到的事件,然后将事件发送到 Elasticsearch。
以下示例配置了一个 Logstash 管道,该管道在端口 5044
上侦听传入的 Elastic Agent 连接,并将接收到的事件路由到 Elasticsearch
input { elastic_agent { port => 5044 enrich => none # don't modify the events' schema at all # or minimal change, add only ssl and source metadata # enrich => [ssl_peer_metadata, source_metadata] } } output { elasticsearch { hosts => ["https://127.0.0.1:9200"] data_stream => "true" } }
有关配置 Logstash 的更多信息,请参阅 配置 Logstash 和 Elastic Agent 输入插件。
Logstash 输出配置设置编辑
logstash
输出支持以下设置,按类别分组。其中许多设置都有合理的默认值,允许您以最少的配置运行 Elastic Agent。
常用设置编辑
设置 | 描述 |
---|---|
(布尔值)启用或禁用输出。如果设置为 |
|
(布尔值)配置字符串中 HTML 的转义。设置为 默认值: |
|
(列表)要连接到的已知 Logstash 服务器列表。如果禁用负载均衡,但配置了多个主机,则随机选择一个主机(没有优先级)。如果一个主机变得不可达,则随机选择另一个主机。 此列表中的所有条目都可以包含端口号。如果没有指定端口,则使用 |
|
(字符串)连接到 Logstash 服务器时要使用的 SOCKS5 代理的 URL。该值必须是方案为 如果 SOCKS5 代理服务器需要客户端身份验证,请在 URL 中嵌入用户名和密码,如示例所示。 使用代理时,主机名在代理服务器上解析,而不是在客户端上解析。要更改此行为,请设置 outputs: default: type: logstash hosts: ["remote-host:5044"] proxy_url: socks5://user:password@socks5-proxy:2233 |
|
(布尔值)确定使用代理时 Logstash 主机名是否在本地解析。如果为 默认值: |
身份验证设置编辑
通过 logstash
输出将数据发送到安全集群时,Elastic Agent 可以使用 SSL/TLS。有关可用设置的列表,请参阅 SSL/TLS,特别是 表 4,“常用配置选项” 和 表 5,“客户端配置选项” 下的设置。
要使用 SSL/TLS,您还必须将 Logstash 的 Elastic Agent 输入插件 配置为使用 SSL/TLS。
有关更多信息,请参阅 为 Logstash 输出配置 SSL/TLS。
内存队列设置编辑
内存队列将所有事件保存在内存中。
内存队列等待输出确认或丢弃事件。如果队列已满,则无法将新事件插入内存队列。只有在收到来自输出的信号后,队列才会释放空间以接受更多事件。
内存队列由参数 flush.min_events
和 flush.timeout
控制。flush.min_events
限制了单个批次中可以包含的事件数量,flush.timeout
指定队列应等待多长时间才能完全填充事件请求。如果输出支持 bulk_max_size
参数,则最大批次大小将是 bulk_max_size
和 flush.min_events
中较小的一个。
flush.min_events
是一个遗留参数,新配置应优先使用 bulk_max_size
来控制批次大小。从 8.13 版本开始,使用 flush.min_events
而不是 bulk_max_size
来限制批次大小永远不会带来性能优势。
在同步模式下,只要有可用事件,就会立即填充事件请求,即使没有足够的事件来填充请求的批次也是如此。这在必须最大限度地减少延迟时非常有用。要使用同步模式,请将 flush.timeout
设置为 0。
为了向后兼容,还可以通过将 flush.min_events
设置为 0 或 1 来激活同步模式。在这种情况下,批次大小将限制为队列容量的 1/2。
在异步模式下,事件请求将等待指定的超时时间,以尝试完全填充请求的批次。如果超时时间到期,队列将返回一个包含所有可用事件的部分批次。要使用异步模式,请将 flush.timeout
设置为正持续时间,例如 5 秒。
此示例配置在有足够事件填充输出请求(通常由 bulk_max_size
控制,并由 flush.min_events
限制为最多 512 个事件)或事件已等待 5 秒但未填充请求的大小时,将事件转发到输出:f 512 个事件可用或最旧的可用事件已在队列中等待 5 秒
queue.mem.events: 4096 queue.mem.flush.min_events: 512 queue.mem.flush.timeout: 5s
设置 | 描述 |
---|---|
队列可以存储的事件数。此值应可以被 默认值: |
|
默认值: |
|
(整数) 默认值: |
性能调优设置编辑
可能影响性能的设置。
设置 | 描述 |
---|---|
(字符串)网络错误后尝试重新连接到 Logstash 之前的等待秒数。等待 默认值: |
|
(字符串)网络错误后尝试连接到 Elasticsearch 之前的最大等待秒数。 默认值: |
|
(整数)单个 Logstash 请求中批量处理的最大事件数。 事件可以收集到批次中。Elastic Agent 会将大于 指定较大的批次大小可以通过降低发送事件的开销来提高性能。但是,较大的批次大小也会增加处理时间,这可能会导致 API 错误、连接断开、发布请求超时,最终导致吞吐量降低。 将此值设置为 默认值: |
|
(整数) gzip 压缩级别。将此值设置为 提高压缩级别会减少网络使用量,但会增加 CPU 使用量。 默认值: |
|
如果为 启用
未启用
默认值: 示例 outputs: default: type: logstash hosts: ["localhost:5044", "localhost:5045"] loadbalance: true |
|
(整数) 发布失败后重试发布事件的次数。在指定的重试次数后,通常会丢弃事件。 将 默认值: |
|
(整数) 在等待 Logstash 的 ACK 时异步发送到 Logstash 的批次数。在写入指定数量的批次后,输出将变为阻塞状态。指定 默认值: |
|
(布尔值) 如果为 默认值: |
|
(字符串) 等待 Logstash 服务器响应的秒数,超时后将超时。 默认值: |
|
(字符串) 与 Logstash 的连接的生存时间,在此时间之后将重新建立连接。当 Logstash 主机代表负载均衡器时,此设置非常有用。由于与 Logstash 主机的连接是粘性的,因此在负载均衡器后面运行可能会导致实例之间的负载分配不均。在连接上指定 TTL 以实现跨实例的均匀连接分配。 默认值: 异步 Logstash 客户端( |
|
(整数) 每个已配置主机发布事件的工作线程数。示例:如果您有两个主机和三个工作线程,则总共会启动六个工作线程(每个主机三个)。 默认值: |