Elasticsearch 过滤器插件

编辑

Elasticsearch 过滤器插件

编辑
  • 插件版本:v3.16.1
  • 发布日期:2023-09-29
  • 更新日志

有关其他版本,请参阅版本化插件文档

获取帮助

编辑

有关插件的问题,请在 Discuss 论坛中开一个主题。有关错误或功能请求,请在 Github 中开一个问题。有关 Elastic 支持的插件列表,请查阅 Elastic 支持矩阵

描述

编辑

在 Elasticsearch 中搜索之前的日志事件,并将其中的一些字段复制到当前事件中。以下是此过滤器可能使用的两个完整示例。

第一个示例使用传统的 *query* 参数,用户只能使用 Elasticsearch query_string。每当 logstash 接收到 “end” 事件时,它会使用此 elasticsearch 过滤器根据某些操作标识符查找匹配的 “start” 事件。然后,它会将 “start” 事件的 @timestamp 字段复制到 “end” 事件的新字段中。最后,通过组合使用 “date” 过滤器和 “ruby” 过滤器,我们计算出两个事件之间的小时持续时间。

if [type] == "end" {
   elasticsearch {
      hosts => ["es-server"]
      query => "type:start AND operation:%{[opid]}"
      fields => { "@timestamp" => "started" }
   }

   date {
      match => ["[started]", "ISO8601"]
      target => "[started]"
   }

   ruby {
      code => "event.set('duration_hrs', (event.get('@timestamp') - event.get('started')) / 3600)"
   }
}

下面的示例重现了上面的示例,但使用了 query_template。此 query_template 表示完整的 Elasticsearch 查询 DSL,并支持标准的 Logstash 字段替换语法。下面的示例发出与第一个示例相同的查询,但使用显示的模板。

if [type] == "end" {
      elasticsearch {
         hosts => ["es-server"]
         query_template => "template.json"
         fields => { "@timestamp" => "started" }
      }

      date {
         match => ["[started]", "ISO8601"]
         target => "[started]"
      }

      ruby {
         code => "event.set('duration_hrs', (event.get('@timestamp') - event.get('started')) / 3600)"
      }
}

template.json

{
  "size": 1,
  "sort" : [ { "@timestamp" : "desc" } ],
  "query": {
    "query_string": {
      "query": "type:start AND operation:%{[opid]}"
    }
  },
  "_source": ["@timestamp"]
}

如上所示,通过使用 *opid*,可以引用模板中 Logstash 事件的字段。模板将在用于查询 Elasticsearch 之前按事件填充。

另请注意,当您使用 query_template 时,Logstash 属性 result_sizesort 将被忽略。它们应该直接在 JSON 模板中指定,如上面的示例所示。

身份验证

编辑

可以使用以下选项中的*一个*对安全的 Elasticsearch 集群进行身份验证

授权

编辑

对安全的 Elasticsearch 集群进行授权需要在索引级别具有 read 权限,并在集群级别具有 monitoring 权限。集群级别的 monitoring 权限是执行定期连接检查所必需的。

Elasticsearch 过滤器配置选项

编辑

此插件支持以下配置选项以及稍后描述的常用选项Elasticsearch 过滤器已弃用配置选项

另请参阅常用选项,以获取所有过滤器插件支持的选项列表。

 

aggregation_fields

编辑
  • 值类型为 哈希
  • 默认值为 {}

要从 elasticsearch 响应复制到 Logstash 事件字段的聚合名称的哈希

示例

    filter {
      elasticsearch {
        aggregation_fields => {
          "my_agg_name" => "my_ls_field"
        }
      }
    }

api_key

编辑
  • 值类型为 密码
  • 此设置没有默认值。

使用 Elasticsearch API 密钥进行身份验证。请注意,此选项还需要启用 ssl_enabled 选项。

格式为 id:api_key,其中 idapi_key 由 Elasticsearch 创建 API 密钥 API 返回。

ca_trusted_fingerprint

编辑
  • 值类型为 字符串,并且必须包含正好 64 个十六进制字符。
  • 此设置没有默认值。
  • 使用此选项 *需要* Logstash 8.3+

要信任的 SSL 证书颁发机构的 SHA-256 指纹,例如 Elasticsearch 集群的自动生成的自签名 CA。

cloud_auth

编辑
  • 值类型为 密码
  • 此设置没有默认值。

云身份验证字符串(“<用户名>:<密码>” 格式)是 user/ password 对的替代方案。

有关更多信息,请查看 Logstash 到云的文档

cloud_id

编辑
  • 值类型为 字符串
  • 此设置没有默认值。

来自 Elastic Cloud Web 控制台的 Cloud ID。如果设置了 hosts,则不应使用。

有关更多信息,请查看 Logstash 到云的文档

docinfo_fields

编辑
  • 值类型为 哈希
  • 默认值为 {}

要从旧事件(通过 elasticsearch 查找)复制到新事件的 docinfo 字段的哈希

示例

    filter {
      elasticsearch {
        docinfo_fields => {
          "_id" => "document_id"
          "_index" => "document_index"
        }
      }
    }

enable_sort

编辑

是否应排序结果

fields

编辑
  • 值类型为 数组
  • 默认值为 {}

要从旧事件(通过 elasticsearch 查找)复制到当前正在处理的新事件的字段数组。

在以下示例中,通过 elasticsearch 找到的事件的 @timestampevent_id 的值分别复制到当前事件的 startedstart_id 字段

fields => {
  "@timestamp" => "started"
  "event_id" => "start_id"
}

hosts

编辑
  • 值类型为 数组
  • 默认值为 ["localhost:9200"]

用于查询的 elasticsearch 主机列表。

index

编辑

要搜索的索引名称的逗号分隔列表;使用 _all 或空字符串以对所有索引执行操作。可以使用字段替换(例如,index-name-%{date_field}

password

编辑
  • 值类型为 密码
  • 此设置没有默认值。

基本身份验证 - 密码

proxy

编辑
  • 值类型为 uri
  • 此设置没有默认值。

设置转发 HTTP 代理的地址。空字符串被视为未设置代理,并且在使用环境变量时很有用,例如 proxy => '${LS_PROXY:}'

query

编辑
  • 值类型为 字符串
  • 此设置没有默认值。

Elasticsearch 查询字符串。有关更多信息,请参见Elasticsearch 查询字符串文档。使用 queryquery_template

query_template

编辑
  • 值类型为 字符串
  • 此设置没有默认值。

采用 DSL 格式的 elasticsearch 查询的文件路径。有关更多信息,请参见Elasticsearch 查询文档。使用 queryquery_template

result_size

编辑
  • 值类型为 数字
  • 默认值为 1

要返回多少个结果

retry_on_failure

编辑
  • 值类型为 数字
  • 默认值为 0 (禁用重试)

重试单个失败请求的次数。

启用后,重试导致连接错误或 HTTP 状态代码包含在retry_on_status中的请求

retry_on_status

编辑
  • 值类型为 数组
  • 默认值为空列表 []

在使用retry_on_failure时,要考虑用于重试的 HTTP 状态代码(除了连接错误之外)

sort

编辑
  • 值类型为 字符串
  • 默认值为 "@timestamp:desc"

定义排序顺序的 <字段>:<方向> 对的逗号分隔列表

ssl_certificate

编辑
  • 值类型为 路径
  • 此设置没有默认值。

用于验证客户端身份的 SSL 证书。此证书应该是 OpenSSL 样式的 X.509 证书文件。

仅当设置了 ssl_key 时,才能使用此设置。

ssl_certificate_authorities

编辑
  • 值类型为 路径列表
  • 此设置没有默认值

用于验证服务器证书的 .cer 或 .pem 文件。

您不能同时使用此设置和 ssl_truststore_path

ssl_cipher_suites

编辑
  • 值类型为 字符串列表
  • 此设置没有默认值

要使用的密码套件列表,按优先级列出。支持的密码套件因 Java 和协议版本而异。

ssl_enabled

编辑
  • 值类型为 布尔值
  • 此设置没有默认值。

启用与 Elasticsearch 集群的 SSL/TLS 安全通信。如果未指定,将使用 hosts 中列出的 URL 中指定的任何方案,或从 cloud_id 中提取的方案。如果未指定显式协议,则将使用纯 HTTP。

ssl_key

编辑
  • 值类型为 路径
  • 此设置没有默认值。

ssl_certificate 对应的 OpenSSL 样式的 RSA 私钥。

仅当设置了 ssl_certificate 时,才能使用此设置。

ssl_keystore_password

编辑
  • 值类型为 密码
  • 此设置没有默认值。

设置密钥库密码

ssl_keystore_path

编辑
  • 值类型为 路径
  • 此设置没有默认值。

用于向服务器呈现证书的密钥库。它可以是 .jks.p12

您不能同时使用此设置和 ssl_certificate

ssl_keystore_type

编辑
  • 值可以是以下任意一个:jkspkcs12
  • 如果未提供,则将从密钥库文件名推断该值。

密钥库文件的格式。它必须是 jkspkcs12

ssl_supported_protocols

编辑
  • 值类型为 字符串
  • 允许的值为:'TLSv1.1''TLSv1.2''TLSv1.3'
  • 默认值取决于所使用的 JDK。使用最新的 Logstash,默认值为 ['TLSv1.2', 'TLSv1.3']'TLSv1.1' 被认为不安全,仅为旧版应用程序提供。

建立与 Elasticsearch 集群的连接时,允许使用的 SSL/TLS 版本列表。

对于 Java 8,'TLSv1.3' 仅在 8u262 (AdoptOpenJDK) 及更高版本中受支持,但需要您在 Logstash 中设置 LS_JAVA_OPTS="-Djdk.tls.client.protocols=TLSv1.3" 系统属性。

如果在任何最近的 JVM(例如 Logstash 打包的 JVM)上将插件配置为使用 'TLSv1.1',则该协议默认情况下处于禁用状态,需要通过更改 $JDK_HOME/conf/security/java.security 配置文件中的 jdk.tls.disabledAlgorithms 来手动启用。也就是说,需要从列表中删除 TLSv1.1

ssl_truststore_password

编辑
  • 值类型为 密码
  • 此设置没有默认值。

设置信任库密码

ssl_truststore_path

编辑
  • 值类型为 路径
  • 此设置没有默认值。

用于验证服务器证书的信任库。它可以是 .jks.p12

您不能同时使用此设置和 ssl_certificate_authorities

ssl_truststore_type

编辑
  • 值可以是以下任意一个:jkspkcs12
  • 如果未提供,则将从信任库文件名推断该值。

信任库文件的格式。它必须是 jkspkcs12

ssl_verification_mode

编辑
  • 值可以是以下任意一个:fullnone
  • 默认值为 full

定义如何验证 TLS 连接中另一方提供的证书

full 验证服务器证书是否具有在 not_before 和 not_after 日期之间的颁发日期;链接到受信任的证书颁发机构 (CA),并且具有与证书中的名称匹配的主机名或 IP 地址。

none 不执行任何证书验证。

将证书验证设置为 none 会禁用 SSL/TLS 的许多安全优势,这非常危险。有关禁用证书验证的更多信息,请阅读 https://www.cs.utexas.edu/~shmat/shmat_ccs12.pdf

tag_on_failure

编辑
  • 值类型为 数组
  • 默认值为 ["_elasticsearch_lookup_failure"]

在查找先前日志事件信息失败时标记该事件。这可用于后续分析。

user

编辑
  • 值类型为 字符串
  • 此设置没有默认值。

基本身份验证 - 用户名

Elasticsearch 过滤器已弃用的配置选项

编辑

此插件支持以下已弃用的配置。

已弃用的选项可能会在未来的版本中删除。

设置 输入类型 替换为

ca_file

有效的的文件系统路径

ssl_certificate_authorities

keystore

有效的的文件系统路径

ssl_keystore_path

keystore_password

password

ssl_keystore_password

ca_file

编辑

在 3.15.0 中已弃用。

替换为 ssl_certificate_authorities

  • 值类型为 路径
  • 此设置没有默认值。

SSL 证书颁发机构文件

在 3.15.0 中已弃用。

替换为 ssl_enabled

SSL

keystore

编辑

在 3.15.0 中已弃用。

替换为 ssl_keystore_path

  • 值类型为 路径
  • 此设置没有默认值。

用于向服务器呈现证书的密钥库。它可以是 .jks 或 .p12

keystore_password

编辑

在 3.15.0 中已弃用。

替换为 ssl_keystore_password

  • 值类型为 密码
  • 此设置没有默认值。

设置密钥库密码

通用选项

编辑

所有过滤器插件都支持这些配置选项

add_field

编辑
  • 值类型为 哈希
  • 默认值为 {}

如果此过滤器成功,则向此事件添加任何任意字段。字段名称可以是动态的,并使用 %{field} 包括事件的各个部分。

示例

    filter {
      elasticsearch {
        add_field => { "foo_%{somefield}" => "Hello world, from %{host}" }
      }
    }
    # You can also add multiple fields at once:
    filter {
      elasticsearch {
        add_field => {
          "foo_%{somefield}" => "Hello world, from %{host}"
          "new_field" => "new_static_value"
        }
      }
    }

如果事件的字段为 "somefield" == "hello",则此过滤器在成功时将添加字段 foo_hello(如果存在),其值为上述值,并将 %{host} 部分替换为事件中的该值。第二个示例还将添加一个硬编码字段。

add_tag

编辑
  • 值类型为 数组
  • 默认值为 []

如果此过滤器成功,则向该事件添加任意标签。标签可以是动态的,并使用 %{field} 语法包括事件的各个部分。

示例

    filter {
      elasticsearch {
        add_tag => [ "foo_%{somefield}" ]
      }
    }
    # You can also add multiple tags at once:
    filter {
      elasticsearch {
        add_tag => [ "foo_%{somefield}", "taggedy_tag"]
      }
    }

如果事件的字段为 "somefield" == "hello",则此过滤器在成功时将添加标签 foo_hello(第二个示例当然会添加 taggedy_tag 标签)。

enable_metric

编辑

禁用或启用此特定插件实例的指标日志记录。默认情况下,我们会记录所有可以记录的指标,但您可以禁用特定插件的指标收集。

  • 值类型为 字符串
  • 此设置没有默认值。

向插件配置添加唯一的 ID。如果未指定 ID,Logstash 将生成一个。强烈建议在您的配置中设置此 ID。当您有两个或多个相同类型的插件时,此功能特别有用,例如,如果您有 2 个 Elasticsearch 过滤器。在这种情况下添加命名的 ID 将有助于在使用监控 API 时监控 Logstash。

    filter {
      elasticsearch {
        id => "ABC"
      }
    }

id 字段中的变量替换仅支持环境变量,并且不支持使用来自秘密存储的值。

periodic_flush

编辑

定期调用过滤器刷新方法。可选。

remove_field

编辑
  • 值类型为 数组
  • 默认值为 []

如果此过滤器成功,则从此事件中删除任意字段。字段名称可以是动态的,并使用 %{field} 包括事件的各个部分。示例

    filter {
      elasticsearch {
        remove_field => [ "foo_%{somefield}" ]
      }
    }
    # You can also remove multiple fields at once:
    filter {
      elasticsearch {
        remove_field => [ "foo_%{somefield}", "my_extraneous_field" ]
      }
    }

如果事件的字段为 "somefield" == "hello",则此过滤器在成功时将删除名为 foo_hello 的字段(如果存在)。第二个示例将删除一个额外的、非动态字段。

remove_tag

编辑
  • 值类型为 数组
  • 默认值为 []

如果此过滤器成功,则从事件中删除任意标签。标签可以是动态的,并使用 %{field} 语法包括事件的各个部分。

示例

    filter {
      elasticsearch {
        remove_tag => [ "foo_%{somefield}" ]
      }
    }
    # You can also remove multiple tags at once:
    filter {
      elasticsearch {
        remove_tag => [ "foo_%{somefield}", "sad_unwanted_tag"]
      }
    }

如果事件的字段为 "somefield" == "hello",则此过滤器在成功时将删除标签 foo_hello(如果存在)。第二个示例还将删除一个令人沮丧的、不需要的标签。