Logstash 参考文档其他版本
Logstash 简介
Logstash 入门
- 安装 Logstash
- 存储您的第一个事件
- 使用 Logstash 解析日志
- 将多个输入和输出插件组合在一起
Logstash 的工作原理
- 执行模型
- Logstash 中的 ECS
- 处理细节
设置和运行 Logstash
- Logstash 目录布局
- Logstash 配置文件
- logstash.yml
- 用于安全设置的密钥库
- 从命令行运行 Logstash
- 在 Debian 或 RPM 上作为服务运行 Logstash
- 在 Docker 上运行 Logstash
- 为 Docker 配置 Logstash
- 在 Kubernetes 上运行 Logstash
- 在 Windows 上运行 Logstash
- 日志记录
- 关闭 Logstash
升级 Logstash
- 使用包管理器升级
- 使用直接下载升级
- 在小版本之间升级
- 将 Logstash 升级到 8.0
创建 Logstash 管道
- 管道的结构
- 访问事件数据和字段
- 使用环境变量
- 将数据发送到 Elastic Cloud (托管的 Elasticsearch 服务)
- Logstash 配置示例
保护您的连接
高级 Logstash 配置
- 多个管道
- 管道到管道通信
- 重新加载配置文件
- 管理多行事件
- Glob 模式支持
- 转换 Ingest 节点管道
Logstash 到 Logstash 通信
- Logstash 到 Logstash：Lumberjack 输出到 Beats 输入
- Logstash 到 Logstash：HTTP 输出到 HTTP 输入
- Logstash 到 Logstash：输出到输入
管理 Logstash
- 集中式管道管理
- 配置集中式管道管理
将 Logstash 与 Elastic Integrations 一起使用
使用 Logstash 模块
- ArcSight 模块
- Netflow 模块 (已弃用)
- Azure 模块 (已弃用)
使用 Filebeat 模块
- 使用摄取管道进行解析
- 示例：设置 Filebeat 模块以与 Kafka 和 Logstash 一起使用
使用 Winlogbeat 模块
队列和数据弹性
- 内存队列
- 持久化队列 (PQ)
- 死信队列 (DLQ)
转换数据
- 执行核心操作
- 反序列化数据
- 提取字段和整理数据
- 使用查找丰富数据
部署和扩展 Logstash
管理 GeoIP 数据库
- GeoIP 数据库管理
- 配置 GeoIP 数据库管理
性能调优
- 性能故障排除
- 调整和分析 Logstash 管道性能
使用 Elastic Agent 监控 Logstash
- 收集用于仪表板的监控数据
- 收集用于仪表板的监控数据（无服务器）
- 收集用于堆栈监控的监控数据
监控 Logstash（旧版）
- Metricbeat 收集
- 旧版收集（已弃用）
- 监控 UI
- 管道查看器 UI
- 故障排除
使用 API 监控 Logstash
- 节点信息 API
- 插件信息 API
- 节点统计 API
- 热线程 API
- 运行状况报告 API
使用插件
- 跨插件概念和特性
- 生成插件
- 离线插件管理
- 私有 Gem 存储库
- 事件 API
集成插件
- aws
- elastic_enterprise_search
- jdbc
- kafka
- logstash
- rabbitmq
- snmp
输入插件
- azure_event_hubs
- beats
- cloudwatch
- couchdb_changes
- dead_letter_queue
- elastic_agent
- elastic_serverless_forwarder
- elasticsearch
- exec
- file
- ganglia
- gelf
- generator
- github
- google_cloud_storage
- google_pubsub
- graphite
- heartbeat
- http
- http_poller
- imap
- irc
- java_generator
- java_stdin
- jdbc
- jms
- jmx
- kafka
- kinesis
- logstash
- log4j
- lumberjack
- meetup
- pipe
- puppet_facter
- rabbitmq
- redis
- relp
- rss
- s3
- s3-sns-sqs
- salesforce
- snmp
- snmptrap
- sqlite
- sqs
- stdin
- stomp
- syslog
- tcp
- twitter
- udp
- unix
- varnishlog
- websocket
- wmi
- xmpp
输出插件
- boundary
- circonus
- cloudwatch
- csv
- datadog
- datadog_metrics
- dynatrace
- elastic_app_search
- elastic_workplace_search
- elasticsearch
- email
- exec
- file
- ganglia
- gelf
- google_bigquery
- google_cloud_storage
- google_pubsub
- graphite
- graphtastic
- http
- influxdb
- irc
- java_stdout
- juggernaut
- kafka
- librato
- logstash
- loggly
- lumberjack
- metriccatcher
- mongodb
- nagios
- nagios_nsca
- opentsdb
- pagerduty
- pipe
- rabbitmq
- redis
- redmine
- riak
- riemann
- s3
- sink
- sns
- solr_http
- sqs
- statsd
- stdout
- stomp
- syslog
- tcp
- timber
- udp
- webhdfs
- websocket
- xmpp
- zabbix
过滤器插件
- age
- aggregate
- alter
- bytes
- cidr
- cipher
- clone
- csv
- date
- de_dot
- dissect
- dns
- drop
- elapsed
- elastic_integration
- elasticsearch
- environment
- extractnumbers
- fingerprint
- geoip
- grok
- http
- i18n
- java_uuid
- jdbc_static
- jdbc_streaming
- json
- json_encode
- kv
- memcached
- metricize
- metrics
- mutate
- prune
- range
- ruby
- sleep
- split
- syslog_pri
- threats_classifier
- throttle
- tld
- translate
- truncate
- urldecode
- useragent
- uuid
- wurfl_device_detection
- xml
编解码器插件
- avro
- cef
- cloudfront
- cloudtrail
- collectd
- csv
- dots
- edn
- edn_lines
- es_bulk
- fluent
- graphite
- gzip_lines
- jdots
- java_line
- java_plain
- json
- json_lines
- line
- msgpack
- multiline
- netflow
- nmap
- plain
- protobuf
- rubydebug
技巧和最佳实践
- JVM 设置
故障排除
- Logstash 故障排除
- 插件故障排除
- 特定插件故障排除
- 运行状况报告管道状态
- 运行状况报告管道流：工作器利用率
为 Logstash 做贡献
- 如何编写 Logstash 输入插件
- 如何编写 Logstash 编解码器插件
- 如何编写 Logstash 过滤器插件
- 如何编写 Logstash 输出插件
- Logstash 插件社区维护者指南
- 记录您的插件
- 将您的插件发布到 RubyGems.org
- 列出您的插件
- 为 Logstash 插件贡献补丁
- 扩展 Logstash 核心
贡献 Java 插件
- 如何编写 Java 输入插件
- 如何编写 Java 编解码器插件
- 如何编写 Java 过滤器插件
- 如何编写 Java 输出插件
重大变更
- 8.0 中的重大变更
- 7.0 中的重大变更
- Logstash 6.3.0 之前 PQ 版本的重大变更
- 6.0 中的重大变更
发行说明
- Logstash 8.17.0 发行说明
- Logstash 8.16.1 发行说明
- Logstash 8.16.0 发行说明
- Logstash 8.15.4 发行说明
- Logstash 8.15.3 发行说明
- Logstash 8.15.2 发行说明
- Logstash 8.15.1 发行说明
- Logstash 8.15.0 发行说明
- Logstash 8.14.3 发行说明
- Logstash 8.14.2 发行说明
- Logstash 8.14.1 发行说明
- Logstash 8.14.0 发行说明
- Logstash 8.13.4 发行说明
- Logstash 8.13.3 发行说明
- Logstash 8.13.2 发行说明
- Logstash 8.13.1 发行说明
- Logstash 8.13.0 发行说明
- Logstash 8.12.2 发行说明
- Logstash 8.12.1 发行说明
- Logstash 8.12.0 发行说明
- Logstash 8.11.4 发行说明
- Logstash 8.11.3 发行说明
- Logstash 8.11.2 发行说明
- Logstash 8.11.1 发行说明
- Logstash 8.11.0 发行说明
- Logstash 8.10.4 发行说明
- Logstash 8.10.3 发行说明
- Logstash 8.10.2 发行说明
- Logstash 8.10.1 发行说明
- Logstash 8.10.0 发行说明
- Logstash 8.9.2 发行说明
- Logstash 8.9.1 发行说明
- Logstash 8.9.0 发行说明
- Logstash 8.8.2 发行说明
- Logstash 8.8.1 发行说明
- Logstash 8.8.0 发行说明
- Logstash 8.7.1 发行说明
- Logstash 8.7.0 发行说明
- Logstash 8.6.2 发行说明
- Logstash 8.6.1 发行说明
- Logstash 8.6.0 发行说明
- Logstash 8.5.3 发行说明
- Logstash 8.5.2 发行说明
- Logstash 8.5.1 发行说明
- Logstash 8.5.0 发行说明
- Logstash 8.4.2 发行说明
- Logstash 8.4.1 发行说明
- Logstash 8.4.0 发行说明
- Logstash 8.3.3 发行说明
- Logstash 8.3.2 发行说明
- Logstash 8.3.1 发行说明
- Logstash 8.3.0 发行说明
- Logstash 8.2.3 发行说明
- Logstash 8.2.2 发行说明
- Logstash 8.2.1 发行说明
- Logstash 8.2.0 发行说明
- Logstash 8.1.3 发行说明
- Logstash 8.1.2 发行说明
- Logstash 8.1.1 发行说明
- Logstash 8.1.0 发行说明
- Logstash 8.0.1 发行说明
- Logstash 8.0.0 发行说明
- Logstash 8.0.0-rc2 发行说明
- Logstash 8.0.0-rc1 发行说明
- Logstash 8.0.0-beta1 发行说明
- Logstash 8.0.0-alpha2 发行说明
- Logstash 8.0.0-alpha1 发行说明

› ›

管道到管道通信

编辑

管道到管道通信

编辑

当使用 Logstash 的多管道功能时，您可能希望在同一个 Logstash 实例中连接多个管道。此配置有助于隔离这些管道的执行，并有助于分解复杂管道的逻辑。pipeline 输入/输出支持本文档后面讨论的一些高级架构模式。

如果您需要在 Logstash 实例之间建立通信，请使用 Logstash-to-Logstash 通信，或使用中间队列（如 Kafka 或 Redis）。

持久队列 (PQ) 可以帮助数据在管道中流动。请参阅 PQ 和管道到管道通信，了解 PQ 如何增强您的管道到管道通信策略。

配置概述

编辑

使用 pipeline 输入和 pipeline 输出连接在同一 Logstash 实例中运行的两个管道。这些输入使用客户端-服务器方法，其中 pipeline 输入注册一个虚拟地址，pipeline 输出可以连接到该地址。

创建一个下游管道，该管道侦听虚拟地址上的事件。
创建一个上游管道，该管道生成事件，并通过 pipeline 输出将其发送到一个或多个虚拟地址。

这是一个简单的配置示例。

# config/pipelines.yml
- pipeline.id: upstream
  config.string: input { stdin {} } output { pipeline { send_to => [myVirtualAddress] } }
- pipeline.id: downstream
  config.string: input { pipeline { address => myVirtualAddress } }

工作原理

编辑

pipeline 输入充当一个虚拟服务器，侦听本地进程中的单个虚拟地址。只有在同一本地 Logstash 上运行的 pipeline 输出才能将事件发送到此地址。管道 输出可以将事件发送到虚拟地址列表。如果下游管道被阻止或不可用，pipeline 输出将被阻止。

当事件跨管道发送时，其数据将被完全复制。对下游管道中事件的修改不会影响任何上游管道中的该事件。

pipeline 插件可能是管道之间通信的最有效方式，但它仍然会产生性能成本。Logstash 必须在 Java 堆上为每个下游管道完整复制每个事件。使用此功能可能会影响 Logstash 的堆内存利用率。

交付保证

编辑

在其标准配置中，pipeline 输入/输出具有至少一次交付保证。如果地址被阻止或不可用，输出将被阻止。

默认情况下，pipeline 输出上的 ensure_delivery 选项设置为 true。如果将 ensure_delivery 标志更改为 false，则不可用的下游管道会导致发送的消息被丢弃。请注意，只有当管道正在启动或重新加载时才会被视为不可用，而不是当它可能包含的任何插件被阻止时。一个被阻止的下游管道会阻止发送输出/管道，无论 ensure_delivery 标志的值如何。当您希望在不阻止任何向上游管道发送的情况下临时禁用下游管道时，请使用 ensure_delivery => false。

这些交付保证也说明了此功能的关闭行为。在执行管道重新加载时，更改将根据用户请求立即进行，即使这意味着删除从上游管道接收事件的下游管道也是如此。这将导致上游管道被阻止。您必须恢复下游管道才能干净地关闭 Logstash。您可以发出强制终止，但除非为该管道启用了持久队列，否则正在进行的事件可能会丢失。

避免循环

编辑

连接管道时，请保持数据单向流动。循环数据或将管道连接到循环图中可能会导致问题。Logstash 会等待每个管道的工作完成后再关闭。管道循环可能会阻止 Logstash 干净地关闭。

架构模式

编辑

您可以使用 pipeline 输入和输出更好地组织代码、简化控制流并隔离复杂配置的性能。连接管道的方式有很多种。这里介绍的方式提供了一些想法。

这些示例使用 config.string 来说明流程。您还可以将配置文件用于管道到管道通信。

分配器模式

编辑

当单个输入中有多种类型的数据进入，每种类型都有其自己的一组复杂处理规则时，可以使用分配器模式。使用分配器模式，一个管道用于根据类型将数据路由到其他管道。每种类型都将路由到仅具有处理该类型的逻辑的管道。通过这种方式，可以隔离每种类型的逻辑。

例如，在许多组织中，可以使用单个 Beats 输入来接收来自各种来源的流量，每个来源都有其自己的处理逻辑。处理此类数据的常用方法是使用一些 if 条件来分隔流量并以不同的方式处理每种类型。当配置又长又复杂时，这种方法可能会很快变得混乱。

这是一个分配器模式配置示例。

# config/pipelines.yml
- pipeline.id: beats-server
  config.string: |
    input { beats { port => 5044 } }
    output {
        if [type] == apache {
          pipeline { send_to => weblogs }
        } else if [type] == system {
          pipeline { send_to => syslog }
        } else {
          pipeline { send_to => fallback }
        }
    }
- pipeline.id: weblog-processing
  config.string: |
    input { pipeline { address => weblogs } }
    filter {
       # Weblog filter statements here...
    }
    output {
      elasticsearch { hosts => [es_cluster_a_host] }
    }
- pipeline.id: syslog-processing
  config.string: |
    input { pipeline { address => syslog } }
    filter {
       # Syslog filter statements here...
    }
    output {
      elasticsearch { hosts => [es_cluster_b_host] }
    }
- pipeline.id: fallback-processing
    config.string: |
    input { pipeline { address => fallback } }
    output { elasticsearch { hosts => [es_cluster_b_host] } }

请注意，由于每个管道仅处理一个特定的任务，因此数据流的跟踪非常简单。

输出隔离器模式

编辑

如果多个输出之一发生临时故障，可以使用输出隔离器模式来防止 Logstash 被阻止。默认情况下，当任何单个输出关闭时，Logstash 会被阻止。此行为对于保证至少一次交付数据非常重要。

例如，服务器可能被配置为将日志数据发送到 Elasticsearch 和 HTTP 端点。由于定期服务或其他原因，HTTP 端点可能经常不可用。在这种情况下，当 HTTP 端点关闭时，数据将暂停发送到 Elasticsearch。

使用输出隔离器模式和持久队列，即使一个输出关闭，我们也可以继续发送到 Elasticsearch。

以下是使用输出隔离器模式的此场景示例。

# config/pipelines.yml
- pipeline.id: intake
  config.string: |
    input { beats { port => 5044 } }
    output { pipeline { send_to => [es, http] } }
- pipeline.id: buffered-es
  queue.type: persisted
  config.string: |
    input { pipeline { address => es } }
    output { elasticsearch { } }
- pipeline.id: buffered-http
  queue.type: persisted
  config.string: |
    input { pipeline { address => http } }
    output { http { } }

在此架构中，每个输出都有自己的队列，具有自己的调整和设置。请注意，此方法使用的磁盘空间最多是单个管道的两倍，并且产生的序列化/反序列化成本是单个管道的三倍。

如果下游管道（在上面的示例中为 buffered-es 和 buffered-http）的任何持久队列已满，则两个输出都将停止。

分叉路径模式

编辑

对于必须根据不同的规则集多次处理单个事件的情况，可以使用分叉路径模式。在 pipeline 输入和输出可用之前，这种需求通常通过创造性地使用 clone 过滤器和 if/else 规则来解决。

让我们想象一个用例，我们在其中接收数据并在我们自己的系统中索引完整事件，但将数据的修订版本发布到合作伙伴的 S3 存储桶。我们可能会使用上面描述的输出隔离器模式来分离我们对任一系统的写入。分叉路径模式的突出特点是下游管道中存在其他规则。

以下是分叉路径配置示例。

# config/pipelines.yml
- pipeline.id: intake
  queue.type: persisted
  config.string: |
    input { beats { port => 5044 } }
    output { pipeline { send_to => ["internal-es", "partner-s3"] } }
- pipeline.id: buffered-es
  queue.type: persisted
  config.string: |
    input { pipeline { address => "internal-es" } }
    # Index the full event
    output { elasticsearch { } }
- pipeline.id: partner
  queue.type: persisted
  config.string: |
    input { pipeline { address => "partner-s3" } }
    filter {
      # Remove the sensitive data
      mutate { remove_field => 'sensitive-data' }
    }
    output { s3 { } } # Output to partner's bucket

收集器模式

编辑

当您希望定义许多不同的管道可能使用的一组通用输出和预输出过滤器时，可以使用收集器模式。此模式与分配器模式相反。在此模式中，许多管道流入单个管道，在其中它们共享输出和处理。此模式简化了配置，但代价是降低了隔离性，因为所有数据都通过单个管道发送。

以下是收集器模式的示例。

# config/pipelines.yml
- pipeline.id: beats
  config.string: |
    input { beats { port => 5044 } }
    output { pipeline { send_to => [commonOut] } }
- pipeline.id: kafka
  config.string: |
    input { kafka { ... } }
    output { pipeline { send_to => [commonOut] } }
- pipeline.id: partner
  # This common pipeline enforces the same logic whether data comes from Kafka or Beats
  config.string: |
    input { pipeline { address => commonOut } }
    filter {
      # Always remove sensitive data from all input sources
      mutate { remove_field => 'sensitive-data' }
    }
    output { elasticsearch { } }

« 多管道重新加载配置文件 »

On this page

配置概述
工作原理
交付保证
避免循环
架构模式
分配器模式
输出隔离器模式
分叉路径模式
收集器模式

Was this helpful?

Feedback

The Search AI Company

ELK Stack

Elastic Cloud

Generative AI

Search

Security

Observability

By solution

Industries

Customer spotlight

Research

Build

Learn

Connect

管道到管道通信

管道到管道通信

配置概述

工作原理

交付保证

避免循环

架构模式

分配器模式

输出隔离器模式

分叉路径模式

收集器模式

Follow us

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards