GCP Pub/Sub 输入

编辑

使用 gcp-pubsub 输入从 Google Cloud Pub/Sub 主题订阅读取消息。

例如,此输入可用于接收已导出到 Google Cloud Pub/Sub 主题的 Stackdriver 日志。

可以配置多个 Filebeat 实例从同一订阅读取,以实现高可用性或提高吞吐量。

示例配置

filebeat.inputs:
- type: gcp-pubsub
  project_id: my-gcp-project-id
  topic: vpc-firewall-logs-topic
  subscription.name: filebeat-vpc-firewall-logs-sub
  credentials_file: ${path.config}/my-pubsub-subscriber-credentials.json

配置选项

编辑

除了稍后描述的通用选项之外,gcp-pubsub 输入还支持以下配置选项。

project_id

编辑

Google Cloud 项目 ID。必需。

topic

编辑

Google Cloud Pub/Sub 主题名称。必需。

subscription.name

编辑

要从中读取的订阅的名称。必需。

subscription.create

编辑

布尔值,用于配置输入在订阅不存在时创建订阅。默认值为 true

subscription.num_goroutines

编辑

要创建以从订阅读取的 goroutine 数量。这不会限制可以并发处理的消息数量或输入将创建的最大 goroutine 数量。即使只有一个 goroutine,也可能同时处理许多消息,因为该 goroutine 可能会持续接收消息。要限制正在并发处理的消息数量,请设置 subscription.max_outstanding_messages。默认值为 1。

subscription.max_outstanding_messages

编辑

未处理消息(未确认但尚未过期)的最大数量。如果该值为负数,则未处理消息的数量将没有限制。由于内部队列的存在,输入会一直阻塞,直到达到 queue.mem.flush.min_eventsqueue.mem.flush.timeout。为了防止此阻塞,此选项必须至少为 queue.mem.flush.min_events。默认值为 1600。

credentials_file

编辑

包含用于订阅的凭据和密钥的 JSON 文件的路径。或者,您可以使用 credentials_json 配置选项或依靠Google 应用默认凭据 (ADC)。

credentials_json

编辑

包含用于订阅的凭据和密钥的 JSON 块。如果您想将凭据数据嵌入到配置文件中或将信息放入密钥库中,则可以使用此选项作为 credentials_file 的替代方案。您也可以使用Google 应用默认凭据 (ADC)。

通用选项

编辑

所有输入都支持以下配置选项。

enabled
编辑

使用 enabled 选项启用和禁用输入。默认情况下,enabled 设置为 true。

tags
编辑

Filebeat 在每个发布事件的 tags 字段中包含的一系列标签。标签使您能够轻松地在 Kibana 中选择特定事件或在 Logstash 中应用条件过滤。这些标签将附加到在常规配置中指定的标签列表中。

示例

filebeat.inputs:
- type: gcp-pubsub
  . . .
  tags: ["json"]
fields
编辑

您可以指定的可选字段,以向输出添加其他信息。例如,您可以添加可用于过滤日志数据的字段。字段可以是标量值、数组、字典或这些的任何嵌套组合。默认情况下,您在此处指定的字段将在输出文档中的 fields 子字典下分组。要将自定义字段存储为顶级字段,请将 fields_under_root 选项设置为 true。如果在常规配置中声明了重复字段,则其值将被此处声明的值覆盖。

filebeat.inputs:
- type: gcp-pubsub
  . . .
  fields:
    app_id: query_engine_12
fields_under_root
编辑

如果将此选项设置为 true,则自定义fields 将存储为输出文档中的顶级字段,而不是分组在 fields 子字典下。如果自定义字段名称与 Filebeat 添加的其他字段名称冲突,则自定义字段会覆盖其他字段。

processors
编辑

要应用于输入数据的处理器列表。

有关在配置中指定处理器的信息,请参阅处理器

pipeline
编辑

为此输入生成的事件设置的摄取管道 ID。

管道 ID 也可以在 Elasticsearch 输出中配置,但此选项通常会导致更简单的配置文件。如果在输入和输出中都配置了管道,则使用输入中的选项。

keep_null
编辑

如果将此选项设置为 true,则输出文档中将发布具有 null 值的字段。默认情况下,keep_null 设置为 false

index
编辑

如果存在,此格式化字符串将覆盖此输入事件的索引(对于 elasticsearch 输出),或设置事件元数据的 raw_index 字段(对于其他输出)。此字符串只能引用代理名称和版本以及事件时间戳;要访问动态字段,请使用 output.elasticsearch.index 或处理器。

示例值:"%{[agent.name]}-myindex-%{+yyyy.MM.dd}" 可能会扩展为 "filebeat-myindex-2019.11.01"

publisher_pipeline.disable_host
编辑

默认情况下,所有事件都包含 host.name。此选项可以设置为 true 以禁用将此字段添加到所有事件中。默认值为 false

指标

编辑

此输入在HTTP 监控端点下公开指标。这些指标在 /inputs 路径下公开。它们可用于观察输入的活动。

指标 描述

acked_message_total

成功 ACK 的消息数。

failed_acked_message_total

失败 ACK 的消息数。

nacked_message_total

NACK 的消息数。

bytes_processed_total

已处理的字节数。

processing_time

以纳秒为单位处理事件的经过时间的直方图。