创建失败事务率阈值规则
对于可观测性无服务器项目,需要 Editor 角色或更高级别才能创建失败事务率阈值规则。要了解更多信息,请参阅 分配用户角色和权限。
您可以创建一个失败事务率阈值规则,以便在服务中的事务错误率超过定义的阈值时发出警报。 阈值规则可以在不同级别设置:环境、服务、事务类型和/或事务名称。 添加操作以通过服务或第三方集成(例如,邮件、Slack、Jira)引发警报。

这些步骤演示了如何使用 告警 UI。 您还可以直接从 应用程序 中的任何页面创建失败事务率阈值规则。 单击 告警和规则 按钮,然后选择 创建阈值规则,然后选择 失败事务率。 以这种方式创建规则时,名称 和 标签 字段将预先填充,但您仍然可以更改它们。
要创建失败事务率阈值规则
- 从可观测性 UI 中,转到 告警。
- 从 告警 页面中选择 管理规则,然后选择 创建规则。
- 输入规则的 名称,以及任何可选的 标签 以进行更精细的报告(如果不确定,请留空)。
- 从 APM 用例中选择 失败事务率阈值 规则类型。
- 选择适当的 服务、类型、环境 和 名称(或保留 全部 以包含所有选项)。或者,您可以选择 使用 KQL 筛选器 并输入 KQL 表达式来限制规则的范围。
- 在 高于 中输入失败率(默认为 30%)。
- 在 在过去 中定义要评估的周期(默认为过去 5 分钟)。
- 选择 按以下项对告警分组。 每个唯一值将创建一个告警。
- 定义检查规则的间隔(例如,每 1 分钟检查一次)。
- (可选)设置 操作。
- 保存 您的规则。
您可以使用与第三方系统交互、写入日志或索引或发送用户通知的操作来扩展规则。您可以随时向规则添加操作。您可以在不添加操作的情况下创建规则,也可以为单个规则定义多个操作。
要向规则添加操作,您必须首先为该服务创建一个连接器(例如,电子邮件或外部事件管理系统),然后您可以将其用于不同的规则,每个规则都有自己的操作频率。
连接器类型
连接器提供了一个中心位置来存储与第三方系统进行服务和集成的连接信息。在定义告警规则的操作时,可以使用以下连接器
- 案例
- D3 安全
- 电子邮件
- IBM Resilient
- 索引
- Jira
- Microsoft Teams
- 可观测性 AI 助手
- Opsgenie
- PagerDuty
- 服务器日志
- ServiceNow ITOM
- ServiceNow ITSM
- ServiceNow SecOps
- Slack
- Swimlane
- Torq
- Webhook
- xMatters
某些连接器类型是付费商业功能,而另一些则是免费的。 有关 Elastic 订阅级别的比较,请转到 订阅页面。
有关创建连接器的更多信息,请参阅 连接器。
操作频率
操作变量
使用默认通知消息或自定义消息。 您可以通过单击“添加变量”图标 并从可用变量列表中进行选择,从而向消息添加更多上下文。

以下变量特定于此规则类型。 您还可以指定 所有规则通用的变量。
context.alertDetailsUrl
- 指向告警问题排查视图的链接,以获取更多上下文和详细信息。 如果未配置
server.publicBaseUrl
,则这将是一个空字符串。 context.environment
- 创建告警的事务类型。
context.interval
- 满足告警条件的时间段的长度和单位。
context.reason
- 告警原因的简明描述。
context.serviceName
- 创建告警的服务。
context.threshold
- 任何高于此值的触发值都会导致触发告警。
context.transactionName
- 创建告警的事务名称。
context.transactionType
- 创建告警的事务类型。
context.triggerValue
- 违反阈值并触发告警的值。
context.viewInAppUrl
-
指向告警源的链接。
当服务中的事务错误数超过定义的阈值时,将触发失败事务率阈值告警。
在继续之前,请确定您要为其创建失败事务率阈值规则的服务名称、环境名称和事务类型。
本指南将基于以下条件为错误组 ID 创建告警
- 服务:
{your_service.name}
- 事务:
{your_transaction.name}
- 环境:
{your_service.environment}
- 过去五分钟的错误率高于 30%
- 按
service.name
和service.environment
对告警分组 - 每 1 分钟检查一次
- 通过电子邮件将告警发送给站点可靠性团队
从 应用程序 中的任何页面中,选择 告警和规则 → 创建阈值规则 → 失败事务率。 更改告警的名称(如果您愿意),但不要编辑标签。
根据上述条件,定义以下规则详细信息
- 服务:
{your_service.name}
- 类型:
{your_transaction.name}
- 环境:
{your_service.environment}
- 高于:
30%
- 在过去:
5 分钟
- 按以下项对告警分组:
service.name
service.environment
- 每:
1 分钟
接下来,选择 电子邮件 连接器,然后单击 创建连接器。 填写所需详细信息:发件人、主机、端口等,然后选择 保存。
提供了一个默认消息,作为您的告警的起点。您可以使用 Mustache 模板语法 ({{variable}}
) 在检测到条件时将其他告警值传递给操作。可以通过单击“添加变量”图标 来访问可用变量的列表。
选择 保存。 告警已创建并处于活动状态!