创建 SLO 燃尽率规则
创建 SLO 燃尽率规则,以便在两个不同的回溯周期内,当燃尽率超过定义的阈值时获取警报:一个长周期和一个短周期,短周期是长周期的 1/12。 例如,如果您的长回溯周期为一个小时,则您的短回溯周期为五分钟。
选择要监控的 SLO,然后定义具有适当严重级别的多个燃尽率窗口。 对于每个周期,燃尽率计算为错误率除以错误预算。 当两个周期的燃尽率都超过阈值时,将触发警报。 添加操作以通过服务或第三方集成(例如邮件、Slack、Jira)引发警报。

这些步骤显示了如何使用警报 UI。 您也可以直接从可观测性 → SLO 创建 SLO 燃尽率规则。 单击要为其添加燃尽率规则的 SLO 右侧的更多选项图标 (),然后从菜单中选择
创建新警报规则。
当您使用 UI 创建 SLO 时,会自动创建一个默认的 SLO 燃尽率警报规则。 燃尽率规则将使用默认配置,并且没有连接器。 如果您想收到 SLO 违规的警报,则必须配置一个连接器。
创建 SLO 燃尽率规则
在可观测性 UI 中,转到警报。
从警报页面中选择管理规则,然后选择创建规则。
为您的规则输入一个名称,以及任何可选的标签以进行更精细的报告(如果不确定,请留空)。
从选择规则类型列表中选择 SLO 燃尽率。
选择要监控的 SLO。
为每个操作组定义多个燃尽率窗口(默认为 4 个窗口,但您可以编辑)。
- 回溯(小时):输入此窗口的回溯周期。 将使用等于此周期 1/12 的较短周期来加快恢复速度。
- 燃尽率阈值:为此窗口输入燃尽率。
- 操作组:为此窗口选择一个严重级别。
定义检查规则的间隔,例如每 1 分钟检查一次。
(可选)设置操作。
保存您的规则。
您可以使用与第三方系统交互、写入日志或索引或发送用户通知的操作来扩展您的规则。 您可以随时向规则添加操作。 您可以在不添加操作的情况下创建规则,也可以为一个规则定义多个操作。
要向规则添加操作,您必须首先为该服务(例如,电子邮件或外部事件管理系统)创建一个连接器,然后您可以将其用于不同的规则,每个规则都有自己的操作频率。
连接器类型
连接器提供了一个中心位置来存储与第三方系统的服务和集成连接信息。 定义警报规则的操作时,可以使用以下连接器
- 案例
- D3 Security
- 电子邮件
- IBM Resilient
- 索引
- Jira
- Microsoft Teams
- 可观测性 AI 助手
- Opsgenie
- PagerDuty
- 服务器日志
- ServiceNow ITOM
- ServiceNow ITSM
- ServiceNow SecOps
- Slack
- Swimlane
- Torq
- Webhook
- xMatters
有些连接器类型是付费的商业功能,而另一些则是免费的。 要比较 Elastic 订阅级别,请访问 订阅页面。
有关创建连接器的更多信息,请参阅 连接器。
操作频率
操作变量
使用默认的通知消息或自定义它。 您可以通过单击添加变量图标 并从可用变量列表中进行选择,来向消息添加更多上下文。

以下变量特定于此规则类型。 您还可以指定 所有规则通用的变量。
context.alertDetailsUrl
- 指向警报故障排除视图的链接,用于进一步的上下文和详细信息。 如果未配置
server.publicBaseUrl
,这将是一个空字符串。 context.burnRateThreshold
- 燃尽率阈值。
context.longWindow
- 具有相关燃尽率值的窗口持续时间。
context.reason
- 对警报原因的简明描述。
context.shortWindow
- 具有相关燃尽率值的窗口持续时间。
context.sloId
- SLO 唯一标识符。
context.sloInstanceId
- SLO 实例 ID。
context.sloName
- SLO 名称。
context.timestamp
- 检测到警报的时间戳。
context.viewInAppUrl
-
指向 SLO 详细信息页面的 URL,以帮助进行进一步的调查。
了解如何查看警报和分类 SLO 燃尽率违规