失败事务率阈值规则

编辑

当服务中的事务错误率超过定义的阈值时发出警报。

过滤器和条件
编辑

过滤来自应用程序的事务,以将失败事务率阈值规则应用于特定的服务(SERVICE)、环境(ENVIRONMENT)、事务类型(TYPE)或事务名称(NAME)。或者,您可以启用使用 KQL 过滤器选项,使用KQL 过滤器来限制警报的范围。

然后,您可以指定哪些条件应导致警报。这包括指定:

  • 失败的事务百分比(高于)。
  • 发生故障的时间范围(最近),以秒、分钟、小时或天为单位。
分组
编辑

为自定义阈值规则设置一个或多个按以下字段分组警报,以对所选字段执行复合聚合。当任何这些组匹配所选的规则条件时,会按组触发警报。

当您选择多个分组时,组名用逗号分隔。

当您选择如果某个组停止报告数据则发出警报时,如果先前报告指标的组在预期时间段内没有再次报告指标,则会触发该规则。

规则计划
编辑

定义以秒、分钟、小时或天为单位评估条件的频率。检查会排队,以便在容量允许的情况下尽可能接近定义的值运行。

高级选项
编辑

(可选)定义警报延迟。只有当指定的连续运行次数都满足规则条件时,才会发出警报。

操作
编辑

通过将规则连接到使用内置集成的操作来扩展规则。

操作类型编辑

通过将规则连接到使用以下支持的内置集成的操作来扩展规则。

某些连接器类型是付费商业功能,而另一些是免费的。要比较 Elastic 订阅级别,请转到订阅页面

操作频率编辑

选择连接器后,必须设置操作频率。您可以选择在每个检查间隔或自定义间隔上创建警报摘要。或者,您可以设置操作频率,以便选择操作的运行频率(例如,在每个检查间隔、仅在警报状态更改时或在自定义操作间隔)。

您还可以通过指定仅当操作匹配 KQL 查询或在特定时间范围内发生警报时才运行操作来进一步优化操作运行的条件

  • 如果警报匹配查询:输入 KQL 查询,该查询定义必须满足才能发送通知的字段值对或查询条件。该查询仅在为规则指定的索引中搜索警报文档。
  • 如果警报在时间范围内生成:设置时间范围详细信息。仅当在您定义的时间范围内生成警报时,才会发送通知。
操作变量编辑

默认消息是作为警报的起点提供的。如果您想自定义消息,可以通过单击消息文本框上方的图标并从可用变量列表中进行选择,从而向消息添加更多上下文。

要将变量添加到警报消息,请使用Mustache模板语法,例如 {{variable.name}}

apm failed transaction rate threshold rule action variables

以下变量是此规则类型特有的。您还可以指定所有规则通用的变量

context.alertDetailsUrl
指向警报故障排除视图的链接,以获取更多上下文和详细信息。如果未配置 server.publicBaseUrl,则这将是一个空字符串。
context.environment
创建警报的事务类型
context.interval
满足警报条件的时间段的长度和单位
context.reason
警报原因的简明描述
context.serviceName
创建警报的服务
context.threshold
任何高于此值的触发值都会导致触发警报
context.transactionName
创建警报的事务名称
context.transactionType
创建警报的事务类型
context.triggerValue
违反阈值并触发警报的值
context.viewInAppUrl
指向警报源的链接