延迟阈值规则
编辑延迟阈值规则
编辑当延迟或失败事务率异常时发出警报。阈值规则可以像您希望的那样广泛或精细,使您能够准确定义何时希望收到警报——无论是在环境级别、服务名称级别、事务类型级别和/或事务名称级别。
筛选器和条件
编辑筛选来自您的应用程序的事务,以将延迟阈值规则应用于特定服务 (SERVICE
)、环境 (ENVIRONMENT
)、事务类型 (TYPE
) 或事务名称 (NAME
)。或者,您可以切换 使用 KQL 筛选器 选项,使用 KQL 筛选器 来限制警报的范围。
然后,您可以指定哪些条件应导致警报。这包括指定
- 要评估的延迟指标 (
WHEN
):平均值、第 95 百分位数或第 99 百分位数。 - 所选延迟指标的最小值 (
IS ABOVE
),单位为毫秒。 - 发生故障的时间范围 (
FOR THE LAST
),单位为秒、分钟、小时或天。
分组
编辑为自定义阈值规则设置一个或多个 按以下字段对告警进行分组 字段,以针对所选字段执行复合聚合。当这些组中的任何一个匹配所选的规则条件时,将按组触发警报。
当您选择多个分组时,组名称用逗号分隔。
当您选择 如果组停止报告数据则发出告警 时,如果先前报告指标的组在预期的时间段内不再报告指标,则会触发该规则。
规则计划
编辑定义评估条件的频率,单位为秒、分钟、小时或天。检查会排队,以便在容量允许的情况下尽可能接近定义的值运行。
高级选项
编辑(可选)定义 告警延迟。仅当指定数量的连续运行满足规则条件时,才会发生告警。
操作
编辑通过将规则连接到使用内置集成的操作来扩展规则。
通过将规则连接到使用以下受支持的内置集成的操作来扩展规则。
某些连接器类型是付费的商业功能,而其他连接器类型是免费的。要比较 Elastic 订阅级别,请转到订阅页面。
选择连接器后,您必须设置操作频率。您可以选择在每次检查间隔或自定义间隔创建告警摘要。或者,您可以设置操作频率,以便您选择操作运行的频率(例如,在每次检查间隔、仅当告警状态更改时或在自定义操作间隔)。
您还可以通过指定仅当操作匹配 KQL 查询或在特定时间范围内发生告警时才运行操作,从而进一步细化操作运行的条件
- 如果告警匹配查询:输入一个 KQL 查询,该查询定义必须满足才能发送通知的字段-值对或查询条件。该查询仅搜索规则指定的索引中的告警文档。
- 如果告警在时间范围内生成:设置时间范围详细信息。仅当在您定义的时间范围内生成告警时,才会发送通知。
提供默认消息作为告警的起点。如果您想自定义消息,请通过单击消息文本框上方的图标并从可用变量列表中选择来为消息添加更多上下文。
要将变量添加到告警消息中,请使用 Mustache 模板语法,例如 {{variable.name}}
。
以下变量是此规则类型特有的。您还可以指定所有规则通用的变量。
-
context.alertDetailsUrl
- 指向告警故障排除视图的链接,以获取更多上下文和详细信息。如果未配置 server.publicBaseUrl,则这将是一个空字符串。
-
context.environment
- 创建告警的事务类型。
-
context.interval
- 满足告警条件的时间段的长度和单位。
-
context.reason
- 对告警原因的简洁描述。
-
context.serviceName
- 创建告警的服务。
-
context.threshold
- 高于此值的任何触发值都将导致触发告警。
-
context.transactionName
- 创建告警的事务名称。
-
context.transactionType
- 创建告警的事务类型。
-
context.triggerValue
- 违反阈值并触发告警的值。
-
context.viewInAppUrl
- 指向告警源的链接。