延迟阈值规则

编辑

当延迟或事务失败率异常时发出告警。阈值规则可以根据您的需要设置宽松或严格的粒度,使您可以精确定义何时需要发出告警——无论是在环境级别、服务名称级别、事务类型级别和/或事务名称级别。

过滤器和条件
编辑

过滤来自应用程序的事务,以便将延迟阈值规则应用于特定服务(SERVICE)、环境(ENVIRONMENT)、事务类型(TYPE)或事务名称(NAME)。或者,您可以使用 KQL 过滤器 通过启用 使用 KQL 过滤器 选项来限制告警范围。

然后,您可以指定哪些条件应导致告警。这包括指定:

  • 要评估的延迟度量值(WHEN):平均值、第 95 百分位数或第 99 百分位数。
  • 所选延迟度量值的最小值(IS ABOVE)(以毫秒为单位)。
  • 故障必须发生的时段(FOR THE LAST)(以秒、分钟、小时或天为单位)。
分组
编辑

为自定义阈值规则设置一个或多个 按分组告警 字段,以便对选定字段执行复合聚合。当这些组中的任何一个与选定的规则条件匹配时,将每个组触发一个告警。

选择多个分组时,组名用逗号分隔。

选择 如果某个组停止报告数据,则向我发出警报 时,如果先前报告指标的组在预期的时间段内不再报告指标,则会触发该规则。

规则计划
编辑

定义以秒、分钟、小时或天为单位评估条件的频率。检查会排队,因此它们会在容量允许的情况下尽可能接近定义的值运行。

高级选项
编辑

可以选择定义 告警延迟。只有当指定数量的连续运行满足规则条件时,才会发出告警。

操作
编辑

通过将规则连接到使用内置集成的操作来扩展规则。

操作类型编辑

通过将规则连接到使用以下支持的内置集成的操作来扩展规则。

某些连接器类型是付费商业功能,而其他连接器类型是免费的。有关 Elastic 订阅级别的比较,请访问 订阅页面

操作频率编辑

选择连接器后,必须设置操作频率。您可以选择在每个检查间隔或自定义间隔创建告警摘要。或者,您可以设置操作频率,以便选择操作运行的频率(例如,在每个检查间隔、仅当告警状态更改时或在自定义操作间隔时)。

您还可以通过指定操作仅在匹配 KQL 查询或在特定时间范围内发生告警时运行来进一步优化操作运行的条件。

  • 如果告警匹配查询:输入一个 KQL 查询,该查询定义必须满足的字段值对或查询条件才能发送通知。该查询仅搜索规则指定的索引中的告警文档。
  • 如果在时间范围内生成告警:设置时间范围详细信息。只有在您定义的时间范围内生成告警时,才会发送通知。
操作变量编辑

提供默认消息作为告警的起点。如果要自定义消息,请单击消息文本框上方的图标,然后从可用变量列表中选择以向消息添加更多上下文。

要向告警消息添加变量,请使用 Mustache 模板语法,例如 {{variable.name}}

apm latency threshold rule action variables

以下变量特定于此规则类型。您还可以指定 所有规则共有的变量

context.alertDetailsUrl
指向告警故障排除视图的链接,用于获取更多上下文和详细信息。如果未配置 server.publicBaseUrl,则此链接将为空字符串。
context.environment
创建告警的事务类型。
context.interval
满足告警条件的时间段的长度和单位。
context.reason
对告警原因的简要说明。
context.serviceName
创建告警的服务。
context.threshold
任何高于此值的触发值都会导致告警触发。
context.transactionName
创建告警的事务名称。
context.transactionType
创建告警的事务类型。
context.triggerValue
违反阈值并触发告警的值。
context.viewInAppUrl
指向告警源的链接。