正在加载

创建失败事务率阈值规则

注意

对于可观测性无服务器项目,需要 Editor 角色或更高级别才能创建失败事务率阈值规则。要了解更多信息,请参阅 分配用户角色和权限

您可以创建一个失败事务率阈值规则,以便在服务中的事务错误率超过定义的阈值时发出警报。 阈值规则可以在不同级别设置:环境、服务、事务类型和/或事务名称。 添加操作以通过服务或第三方集成(例如,邮件、Slack、Jira)引发警报。

Create rule for failed transaction rate threshold alert
提示

这些步骤演示了如何使用 告警 UI。 您还可以直接从 应用程序 中的任何页面创建失败事务率阈值规则。 单击 告警和规则 按钮,然后选择 创建阈值规则,然后选择 失败事务率。 以这种方式创建规则时,名称标签 字段将预先填充,但您仍然可以更改它们。

要创建失败事务率阈值规则

  1. 从可观测性 UI 中,转到 告警
  2. 告警 页面中选择 管理规则,然后选择 创建规则
  3. 输入规则的 名称,以及任何可选的 标签 以进行更精细的报告(如果不确定,请留空)。
  4. 从 APM 用例中选择 失败事务率阈值 规则类型。
  5. 选择适当的 服务类型环境名称(或保留 全部 以包含所有选项)。或者,您可以选择 使用 KQL 筛选器 并输入 KQL 表达式来限制规则的范围。
  6. 高于 中输入失败率(默认为 30%)。
  7. 在过去 中定义要评估的周期(默认为过去 5 分钟)。
  8. 选择 按以下项对告警分组。 每个唯一值将创建一个告警。
  9. 定义检查规则的间隔(例如,每 1 分钟检查一次)。
  10. (可选)设置 操作
  11. 保存 您的规则。

您可以使用与第三方系统交互、写入日志或索引或发送用户通知的操作来扩展规则。您可以随时向规则添加操作。您可以在不添加操作的情况下创建规则,也可以为单个规则定义多个操作。

要向规则添加操作,您必须首先为该服务创建一个连接器(例如,电子邮件或外部事件管理系统),然后您可以将其用于不同的规则,每个规则都有自己的操作频率。

当服务中的事务错误数超过定义的阈值时,将触发失败事务率阈值告警。

在继续之前,请确定您要为其创建失败事务率阈值规则的服务名称、环境名称和事务类型。

本指南将基于以下条件为错误组 ID 创建告警

  • 服务:{your_service.name}
  • 事务:{your_transaction.name}
  • 环境:{your_service.environment}
  • 过去五分钟的错误率高于 30%
  • service.nameservice.environment 对告警分组
  • 每 1 分钟检查一次
  • 通过电子邮件将告警发送给站点可靠性团队

应用程序 中的任何页面中,选择 告警和规则创建阈值规则失败事务率。 更改告警的名称(如果您愿意),但不要编辑标签。

根据上述条件,定义以下规则详细信息

  • 服务{your_service.name}
  • 类型{your_transaction.name}
  • 环境{your_service.environment}
  • 高于: 30%
  • 在过去: 5 分钟
  • 按以下项对告警分组: service.name service.environment
  • 每: 1 分钟

接下来,选择 电子邮件 连接器,然后单击 创建连接器。 填写所需详细信息:发件人、主机、端口等,然后选择 保存

提供了一个默认消息,作为您的告警的起点。您可以使用 Mustache 模板语法 ({{variable}}) 在检测到条件时将其他告警值传递给操作。可以通过单击“添加变量”图标 添加变量 来访问可用变量的列表。

选择 保存。 告警已创建并处于活动状态!

© . All rights reserved.