Useragent 过滤器插件
编辑Useragent 过滤器插件
编辑- 插件版本: v3.3.5
- 发布日期: 2023-09-19
- 更新日志
有关其他版本,请参阅版本化插件文档。
获取帮助
编辑有关插件的问题,请在 Discuss 论坛中开启一个主题。对于错误或功能请求,请在 Github 中开启一个问题。有关 Elastic 支持的插件列表,请参阅 Elastic 支持矩阵。
描述
编辑基于 BrowserScope 数据将用户代理字符串解析为结构化数据
UserAgent 过滤器,添加有关用户代理的信息,如名称、版本、操作系统和设备。
该插件附带 regexes.yaml 数据库,该数据库由 ua-parser 提供,并采用 Apache 2.0 许可证。有关 ua-parser 的更多详细信息,请参阅 https://github.com/ua-parser/uap-core/。
与 Elastic Common Schema (ECS) 的兼容性
编辑此插件可用于将用户代理 (UA) 解析到符合 Elastic Common Schema 的字段中。以下是 ECS 兼容模式 如何影响输出。
禁用 ECS | ECS v1, v8 | 描述 | 注释 |
---|---|---|---|
[name] |
[user_agent][name] |
检测到的 UA 名称 |
|
[version]* |
[user_agent][version] |
检测到的 UA 版本 |
仅在 ECS 模式下可用 |
[major] |
[@metadata][filter][user_agent][version][major] |
UA 主要版本 |
仅在 ECS 模式下作为元数据 |
[minor] |
[@metadata][filter][user_agent][version][minor] |
UA 次要版本 |
仅在 ECS 模式下作为元数据 |
[patch] |
[@metadata][filter][user_agent][version][patch] |
UA 补丁版本 |
仅在 ECS 模式下作为元数据 |
[os_name] |
[user_agent][os][name] |
检测到的操作系统名称 |
|
[os_version]* |
[user_agent][os][version] |
检测到的操作系统版本 |
仅在 ECS 模式下可用 |
[os_major] |
[@metadata][filter][user_agent][os][version][major] |
操作系统主要版本 |
仅在 ECS 模式下作为元数据 |
[os_minor] |
[@metadata][filter][user_agent][os][version][minor] |
操作系统次要版本 |
仅在 ECS 模式下作为元数据 |
[os_patch] |
[@metadata][filter][user_agent][os][version][patch] |
操作系统补丁版本 |
仅在 ECS 模式下作为元数据 |
[os_full] |
[user_agent][os][full] |
完整操作系统名称 |
|
[device] |
[user_agent][device][name] |
设备名称 |
[version]
和 [os_version]
字段是在 Logstash 7.14 中添加的,默认情况下在早期版本中不可用。
示例
filter { useragent { source => 'message' } }
假设一个事件的 message
字段设置为:Mozilla/5.0 (Macintosh; Intel Mac OS X 10.11; rv:45.0) Gecko/20100101 Firefox/45.0
,则会生成以下字段
{ "name"=>"Firefox", "version"=>"45.0", # since plugin version 3.3.0 "major"=>"45", "minor"=>"0", "os_name"=>"Mac OS X", "os_version"=>"10.11", # since plugin version 3.3.0 "os_full"=>"Mac OS X 10.11", "os_major"=>"10", "os_minor"=>"11", "device"=>"Mac" }
并且启用了 ECS
{ "user_agent"=>{ "name"=>"Firefox", "version"=>"45.0", "os"=>{ "name"=>"Mac OS X", "version"=>"10.11", "full"=>"Mac OS X 10.11" }, "device"=>{"name"=>"Mac"}, } }
Useragent 过滤器配置选项
编辑此插件支持以下配置选项以及稍后描述的通用选项。
设置 | 输入类型 | 必需 |
---|---|---|
否 |
||
否 |
||
否 |
||
否 |
||
是 |
||
否 |
另请参阅通用选项,其中列出了所有过滤器插件支持的选项。
ecs_compatibility
编辑- 值类型为 字符串
-
支持的值为
-
disabled
:不使用 ECS 兼容的字段名称(字段可能设置在事件的根级别) -
v1
,v8
:使用与 Elastic Common Schema 兼容的字段(例如,[user_agent][version]
)
-
-
默认值取决于运行的 Logstash 版本
- 当 Logstash 提供
pipeline.ecs_compatibility
设置时,其值将用作默认值 - 否则,默认值为
disabled
。
- 当 Logstash 提供
控制此插件与Elastic Common Schema (ECS)的兼容性。此设置的值会影响 target
的默认值。
lru_cache_size
编辑- 值类型为 数字
- 默认值为
100000
UA 解析的开销非常大。此过滤器使用 LRU 缓存来利用用户代理通常在日志文件中彼此相邻且很少具有随机分布的事实。您设置的值越高,项目就越有可能在缓存中,并且此过滤器运行速度就越快。但是,如果将此值设置得太高,则可能会使用比所需更多的内存。
尝试使用此选项的不同值,以找到最适合您的数据集的性能。
此值必须设置为 > 0 的值。实际上,没有理由不希望这种行为,开销很小,并且速度提升很大。
重要的是要注意,此配置值是全局的。也就是说,用户代理过滤器的所有实例共享同一个缓存。最后声明的缓存大小将获胜。这样做的原因是,在管道中不同点为不同实例设置多个缓存没有任何好处,只会增加缓存未命中的次数并浪费内存。
regexes
编辑- 值类型为 字符串
- 此设置没有默认值。
如果未指定,则默认为 Logstash 附带的 regexes.yaml
。否则,请使用提供的 regexes.yaml
文件。
您可以在此处找到此文件的最新版本:https://github.com/ua-parser/uap-core/blob/master/regexes.yaml
target
编辑- 值类型为 字符串
-
默认值取决于是否启用了
ecs_compatibility
- 禁用 ECS 兼容性:此设置没有默认值
- 启用 ECS 兼容性:
"user_agent"
用于将用户代理数据分配到的字段的名称。
如果未指定,用户代理数据将存储在事件的根级别。
通用选项
编辑所有过滤器插件都支持以下配置选项
设置 | 输入类型 | 必需 |
---|---|---|
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
否 |
||
否 |
add_field
编辑- 值类型为 哈希
- 默认值为
{}
如果此过滤器成功,则向此事件添加任何任意字段。字段名称可以是动态的,并且可以使用 %{field}
包含事件的一部分。
示例
filter { useragent { add_field => { "foo_%{somefield}" => "Hello world, from %{host}" } } }
# You can also add multiple fields at once: filter { useragent { add_field => { "foo_%{somefield}" => "Hello world, from %{host}" "new_field" => "new_static_value" } } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时,如果存在,将添加字段 foo_hello
,其值为上述值,并将 %{host}
部分替换为事件中的值。第二个示例还将添加一个硬编码字段。
add_tag
编辑- 值类型为 数组
- 默认值为
[]
如果此过滤器成功,则向事件添加任意标签。标签可以是动态的,并且可以使用 %{field}
语法包含事件的一部分。
示例
filter { useragent { add_tag => [ "foo_%{somefield}" ] } }
# You can also add multiple tags at once: filter { useragent { add_tag => [ "foo_%{somefield}", "taggedy_tag"] } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时,将添加标签 foo_hello
(第二个示例当然会添加 taggedy_tag
标签)。
id
编辑- 值类型为 字符串
- 此设置没有默认值。
向插件配置添加唯一的 ID
。如果未指定 ID,Logstash 将生成一个 ID。强烈建议您在配置中设置此 ID。当您有两个或多个相同类型的插件时,这尤其有用,例如,如果您有 2 个 useragent 过滤器。在这种情况下,添加一个命名的 ID 将在使用监视 API 时帮助监视 Logstash。
filter { useragent { id => "ABC" } }
id
字段中的变量替换仅支持环境变量,不支持使用来自密钥存储的值。
remove_field
编辑- 值类型为 数组
- 默认值为
[]
如果此过滤器成功,则从此事件中删除任意字段。字段名称可以是动态的,并且可以使用 %{field} 包含事件的一部分。示例
filter { useragent { remove_field => [ "foo_%{somefield}" ] } }
# You can also remove multiple fields at once: filter { useragent { remove_field => [ "foo_%{somefield}", "my_extraneous_field" ] } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时,如果存在,将删除名称为 foo_hello
的字段。第二个示例将删除一个额外的非动态字段。
remove_tag
编辑- 值类型为 数组
- 默认值为
[]
如果此过滤器成功,则从事件中删除任意标签。标签可以是动态的,并且可以使用 %{field}
语法包含事件的一部分。
示例
filter { useragent { remove_tag => [ "foo_%{somefield}" ] } }
# You can also remove multiple tags at once: filter { useragent { remove_tag => [ "foo_%{somefield}", "sad_unwanted_tag"] } }
如果事件具有字段 "somefield" == "hello"
,则此过滤器在成功时,如果存在,将删除标签 foo_hello
。第二个示例还将删除一个令人不快的、不需要的标签。