转换过滤器插件
编辑转换过滤器插件
编辑- 插件版本: v3.4.2
- 发布日期: 2023-06-14
- 更新日志
有关其他版本,请参阅版本化插件文档。
获取帮助
编辑有关插件的问题,请在Discuss论坛中打开一个主题。对于错误或功能请求,请在Github中打开一个问题。有关 Elastic 支持的插件列表,请参阅Elastic 支持矩阵。
描述
编辑一个通用的搜索和替换工具,它使用配置的哈希和/或文件来确定替换值。目前支持 YAML、JSON 和 CSV 文件。每个字典项都是一个键值对。
您可以通过以下两种方式之一指定字典条目
dictionary
配置项可以包含表示映射的哈希。- 可以在
dictionary_path
配置项中指定一个外部文件(logstash 可读取)。
这两种方法不能同时使用;它会产生错误。
在操作上,对于每个事件,会根据字典测试 source
设置中的值,如果它完全匹配(或在启用 regex
配置项时匹配正则表达式),则匹配的值将放入 target
字段,但如果没有匹配,则会改用 fallback
设置字符串。
示例
filter { translate { source => "[http][response][status_code]" target => "[http_status_description]" dictionary => { "100" => "Continue" "101" => "Switching Protocols" "200" => "OK" "500" => "Server Error" } fallback => "I'm a teapot" } }
有时,人们会发现他们有一个字段,其中包含可变大小的值或对象数组,需要进行一些充实。 iterate_on
设置在这些情况下很有用。
或者,对于简单的字符串搜索和替换,仅需少量值,您可以考虑使用 mutate 过滤器的 gsub 函数。
可以提供多值字典值。使用 YAML 或 JSON 字典时,您可以将值作为哈希(映射)或数组数据类型。使用 CSV 字典时,必须使用另一个过滤器(例如 Dissect 或 KV)提取转换中的多个值。
请注意,fallback
是一个字符串,因此在没有匹配的情况下,需要格式化回退设置,以便过滤器可以将多个值提取到正确的字段。
基于文件的字典使用调度程序在单独的线程中加载。如果您设置 refresh_interval
为 300 秒(5 分钟)或更短,则会在重新加载之前检查文件的修改时间。支持非常大的字典,内部测试为 100,000 个键/值,并且我们通过在调度程序线程中进行刷新来最大限度地减少对吞吐量的影响。应使用复制/编辑/重命名或创建/重命名机制对字典文件进行任何正在进行的修改,以避免刷新代码处理不完整的字典内容。
与 Elastic Common Schema (ECS) 的兼容性
编辑如果 source
和 target
相同,则插件充当就地转换器,并且不会产生任何新的事件字段。这是 ECS 兼容模式中的默认行为。
转换过滤器配置选项
编辑此插件支持以下配置选项以及稍后描述的通用选项。
设置 | 输入类型 | 必需 |
---|---|---|
否 |
||
否 |
||
有效的文件系统路径 |
否 |
|
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
是 |
||
否 |
||
否 |
||
否 |
另请参阅通用选项,了解所有过滤器插件支持的选项列表。
dictionary
编辑- 值类型为哈希
- 默认值为
{}
当在 logstash 过滤器配置项中指定时(即不使用 dictionary_path
文件),用于转换的字典。
示例
filter { translate { dictionary => { "100" => "Continue" "101" => "Switching Protocols" "merci" => "thank you" "old version" => "new version" } } }
指定 dictionary
和 dictionary_path
是错误的。
dictionary_path
编辑- 值类型为路径
- 此设置没有默认值。
外部字典文件的完整路径。表的格式应为标准 YAML、JSON 或 CSV。
在引号中指定任何基于整数的键。从事件的 source
设置中获取的值将转换为字符串。查找字典键也必须是字符串,并且引号使基于整数的键充当字符串。例如,YAML 文件应如下所示
"100": Continue "101": Switching Protocols merci: gracias old version: new version
指定 dictionary
和 dictionary_path
是错误的。
当前支持的格式为 YAML、JSON 和 CSV。格式选择基于文件扩展名:JSON 为 json
,YAML 为 yaml
或 yml
,CSV 为 csv
。CSV 格式需要恰好两列,第一列用作原始文本(查找键),第二列用作转换。
ecs_compatibility
编辑- 值类型为字符串
-
支持的值为
-
disabled
:禁用 ECS 兼容性 -
v1
、v8
:与 Elastic Common Schema 的指定主要版本兼容
-
-
默认值取决于运行的 Logstash 版本
- 当 Logstash 提供
pipeline.ecs_compatibility
设置时,其值将用作默认值 - 否则,默认值为
disabled
。
- 当 Logstash 提供
控制此插件与Elastic Common Schema (ECS)的兼容性。此设置的值会影响target
的默认值。
exact
编辑- 值类型为布尔值
- 默认值为
true
当 exact => true
时,转换过滤器将使用字典值的确切内容填充目标字段。当 exact => false
时,过滤器将使用任何现有目标字段的数据结果填充目标字段,并将转换后的值就地替换。
例如,考虑这个简单的 translation.yml,配置为检查 data
字段
foo: bar
如果 logstash 收到一个 data
字段设置为 foo
的事件,并且 exact => true
,则目标字段将使用字符串 bar
填充。如果 exact => false
,并且 logstash 收到相同的事件,则目标字段也将设置为 bar
。但是,如果 logstash 收到一个 data
字段设置为 foofing
的事件,则目标字段将设置为 barfing
。
如果您想使用字典键作为正则表达式进行匹配,请同时设置 exact => true
和 regex => `true
。在这种情况下,匹配大型字典可能会很昂贵。
fallback
编辑- 值类型为字符串
- 此设置没有默认值。
如果事件中没有发生转换(没有匹配),这将添加一个默认转换字符串,如果匹配失败,该字符串将始终填充 field
。
例如,如果我们使用以下字典配置 fallback => "no match"
foo: bar
然后,如果 logstash 收到一个 foo
字段设置为 bar
的事件,则目标字段将设置为 bar
。但是,如果 logstash 收到一个 foo
设置为 nope
的事件,则目标字段仍将填充,但值为 no match
。此配置可以是动态的,并使用 %{field}
语法包含事件的各个部分。
iterate_on
编辑- 值类型为字符串
- 此设置没有默认值。
当您需要执行充实的值是可变大小的数组时,请在此设置中指定字段名称。此设置引入两种模式,1) 当值是字符串数组时,2) 当值是对象数组时(如 JSON 对象)。
在第一种模式下,您应该在 source
和 iterate_on
中具有相同的字段名称,结果将是一个添加到 target
设置中指定的字段的数组。此数组将在每个搜索值的相同序数位置具有查找的值(或 fallback
值或 nil)。
在第二种模式下,在 iterate_on
中指定具有对象数组的字段,然后使用 source
指定每个对象中提供搜索值的字段,并使用 target
指定要将查找的值(或 fallback
值)写入的字段。
对于以下字典
100,Yuki 101,Rupert 102,Ahmed 103,Kwame
模式 1 示例
filter { translate { iterate_on => "[collaborator_ids]" source => "[collaborator_ids]" target => "[collaborator_names]" fallback => "Unknown" } }
之前
{ "collaborator_ids": [100,103,110,102] }
之后
{ "collaborator_ids": [100,103,110,102], "collabrator_names": ["Yuki","Kwame","Unknown","Ahmed"] }
模式 2 示例
filter { translate { iterate_on => "[collaborators]" source => "[id]" target => "[name]" fallback => "Unknown" } }
之前
{ "collaborators": [ { "id": 100 }, { "id": 103 }, { "id": 110 }, { "id": 101 } ] }
之后
{ "collaborators": [ { "id": 100, "name": "Yuki" }, { "id": 103, "name": "Kwame" }, { "id": 110, "name": "Unknown" }, { "id": 101, "name": "Rupert" } ] }
override
编辑- 值类型为布尔值
- 默认值取决于是否正在使用就地转换
如果目标(或目标)字段已存在,此配置选项控制过滤器是跳过转换(默认行为)还是使用新的转换值覆盖目标字段值。
如果是原地转换,即 target
与 source
相同(例如启用 ecs_compatibility
时),则允许覆盖。
refresh_behaviour
编辑- 值类型为字符串
- 默认值为
merge
当使用字典文件时,此设置指示如何执行更新。将其设置为 merge
会导致新字典合并到旧字典中。这意味着相同的条目将被更新,但之前存在但新字典中不存在的条目将在合并后保留;replace
会导致整个字典被新字典替换(在更新时删除旧字典的所有条目)。
source
编辑- 这是一个必需的设置。
- 值类型为字符串
- 此设置没有默认值。
Logstash 事件字段的名称,该字段包含要由转换过滤器比较以进行匹配的值(例如 message
、host
、response_code
)。
如果此字段是数组,则只会使用第一个值。
target
编辑- 值类型为字符串
-
默认值取决于是否启用了
ecs_compatibility
- 禁用 ECS 兼容性:
"translation"
- 启用 ECS 兼容性:默认为与
source
相同的值
- 禁用 ECS 兼容性:
您希望使用转换后的代码填充的目标字段。如果您将此值设置为与 source
字段相同的值,则插件将执行替换,并且过滤器将成功。这将覆盖源字段的旧值!
常用选项
编辑所有过滤器插件都支持这些配置选项
设置 | 输入类型 | 必需 |
---|---|---|
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
否 |
add_field
编辑- 值类型为 哈希
- 默认值为
{}
如果此过滤器成功,则向此事件添加任意字段。字段名称可以是动态的,并使用 %{field}
包含事件的部分内容。
示例
filter { translate { add_field => { "foo_%{somefield}" => "Hello world, from %{host}" } } }
# You can also add multiple fields at once: filter { translate { add_field => { "foo_%{somefield}" => "Hello world, from %{host}" "new_field" => "new_static_value" } } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时将添加字段 foo_hello
(如果存在),其值为上述值,并且 %{host}
部分将替换为事件中的该值。第二个示例还将添加一个硬编码字段。
add_tag
编辑- 值类型为 数组
- 默认值为
[]
如果此过滤器成功,则向事件添加任意标记。标记可以是动态的,并使用 %{field}
语法包含事件的部分内容。
示例
filter { translate { add_tag => [ "foo_%{somefield}" ] } }
# You can also add multiple tags at once: filter { translate { add_tag => [ "foo_%{somefield}", "taggedy_tag"] } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时将添加标记 foo_hello
(第二个示例当然会添加一个 taggedy_tag
标记)。
id
编辑- 值类型为 字符串
- 此设置没有默认值。
向插件配置添加唯一的 ID
。如果未指定 ID,Logstash 将生成一个 ID。强烈建议在配置中设置此 ID。当您有两个或多个相同类型的插件时,这尤其有用,例如,如果您有两个转换过滤器。在这种情况下添加命名 ID 将有助于在使用监控 API 时监控 Logstash。
filter { translate { id => "ABC" } }
id
字段中的变量替换仅支持环境变量,不支持使用来自密钥存储的值。
remove_field
编辑- 值类型为 数组
- 默认值为
[]
如果此过滤器成功,则从此事件中删除任意字段。字段名称可以是动态的,并使用 %{field} 包含事件的部分内容。示例
filter { translate { remove_field => [ "foo_%{somefield}" ] } }
# You can also remove multiple fields at once: filter { translate { remove_field => [ "foo_%{somefield}", "my_extraneous_field" ] } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时将删除名称为 foo_hello
的字段(如果存在)。第二个示例将删除一个额外的非动态字段。
remove_tag
编辑- 值类型为 数组
- 默认值为
[]
如果此过滤器成功,则从此事件中删除任意标记。标记可以是动态的,并使用 %{field}
语法包含事件的部分内容。
示例
filter { translate { remove_tag => [ "foo_%{somefield}" ] } }
# You can also remove multiple tags at once: filter { translate { remove_tag => [ "foo_%{somefield}", "sad_unwanted_tag"] } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时将删除标记 foo_hello
(如果存在)。第二个示例也将删除一个不想要的标记。