APM 异常规则

编辑

当服务的延迟、吞吐量或失败事务率出现异常时,会触发 APM 异常规则。

筛选器和条件
编辑

由于应用程序的某些部分可能比其他部分更重要,因此您可能对应用程序中不同服务的异常性能有不同的容忍度。您可以筛选应用程序中的服务,以便将 APM 异常规则应用于特定服务 (SERVICE)、事务类型 (TYPE) 和环境 (ENVIRONMENT)。

然后,您可以指定哪些条件应导致告警。这包括指定:

  • 检测到的异常类型 (检测器类型):延迟吞吐量 和/或 失败事务率
  • 严重级别 (具有指定严重级别的异常):严重主要次要警告
规则计划
编辑

定义以秒、分钟、小时或天为单位评估条件的频率。检查将排队,以便在容量允许的情况下尽可能接近定义的值运行。

高级选项
编辑

(可选)定义 告警延迟。只有当指定数量的连续运行满足规则条件时,才会发生告警。

操作
编辑

通过将规则连接到使用内置集成的操作来扩展规则。

操作类型编辑

支持的内置集成包括:

某些连接器类型是付费商业功能,而其他是免费的。有关 Elastic 订阅级别的比较,请转到 订阅页面

操作频率编辑

选择连接器后,必须设置操作频率。您可以选择在每个检查间隔或自定义间隔创建告警摘要。或者,您可以设置操作频率,以便选择操作的运行频率(例如,在每个检查间隔、仅当告警状态更改时或在自定义操作间隔)。

您还可以通过指定操作仅在它们与 KQL 查询匹配或在特定时间范围内发生告警时运行,来进一步细化操作运行的条件。

  • 如果告警与查询匹配:输入一个 KQL 查询,该查询定义必须满足的字段-值对或查询条件才能发送通知。该查询仅搜索为规则指定的索引中的告警文档。
  • 如果告警在时间范围内生成:设置时间范围详细信息。仅当在您定义的时间范围内生成告警时,才会发送通知。
操作变量编辑

默认消息作为告警的起点提供。如果要自定义消息,请通过单击消息文本框上方的图标并从可用变量列表中选择,向消息添加更多上下文。

要将变量添加到告警消息,请使用 Mustache 模板语法,例如 {{variable.name}}

apm anomaly rule action variables

以下变量是此规则类型特有的。您还可以指定所有规则通用的变量

context.alertDetailsUrl
指向告警故障排除视图的链接,以获取更多上下文和详细信息。如果未配置 server.publicBaseUrl,则这将是一个空字符串。
context.environment
创建告警的事务类型。
context.reason
简要描述告警原因。
context.serviceName
创建告警的服务。
context.threshold
任何高于此值的触发值都会导致告警触发。
context.transactionType
创建告警的事务类型。
context.triggerValue
超出阈值并触发告警的值。
context.viewInAppUrl
指向告警源的链接。