创建服务等级目标 (SLO) 烧毁率规则

编辑

创建服务等级目标 (SLO) 烧毁率规则编辑

要创建和管理 SLO,您需要适当的许可证,并且必须配置SLO 访问权限

您可以创建一个 SLO 烧毁率规则,以便在两个不同的回溯期(一个长周期和一个短周期,短周期是长周期的 1/12)内,烧毁率高于定义的阈值时收到警报。例如,如果您的长回溯期为一小时,则您的短回溯期为五分钟。

对于每个回溯期,烧毁率的计算方式为错误率除以错误预算。当两个周期的烧毁率都超过阈值时,就会触发警报。

当您使用 UI 创建 SLO 时,会自动创建一个默认的 SLO 烧毁率警报规则。烧毁率规则将使用默认配置,并且不使用连接器。如果您希望在 SLO 违规时收到警报,则必须配置连接器。

要创建 SLO 烧毁率规则,请转到可观测性 → SLO。单击要为其添加烧毁率规则的 SLO 右侧的更多选项图标,然后从下拉菜单中选择创建新的警报规则

create new alert rule menu

要创建您的 SLO 烧毁率规则,请执行以下操作

  1. 回溯期(小时)下设置您的长回溯期。您的短回溯期会自动设置。
  2. 设置您的烧毁率阈值。在此字段下方,您将看到距离错误预算耗尽还有多长时间。
  3. 检查间隔字段中设置评估条件的频率。
  4. (可选)在高级选项中更改在发生警报之前必须满足规则条件的连续运行次数。
操作类型编辑

通过将规则连接到使用以下受支持的内置集成的操作来扩展您的规则。操作是 Kibana 服务或与第三方系统的集成,当满足规则条件时,它们作为后台任务在 Kibana 服务器上运行。

您可以在设置页面上配置操作类型。

某些连接器类型是付费商业功能,而其他则是免费的。有关 Elastic 订阅级别的比较,请访问订阅页面

选择连接器后,您必须设置操作频率。您可以选择在每个检查间隔或自定义间隔上创建警报摘要。例如,您可以发送电子邮件通知,每隔十二个小时汇总一次新的、正在进行的和已恢复的警报。

或者,您可以将操作频率设置为每个警报,并指定每个警报必须满足才能运行操作的条件。例如,您只能在警报状态更改为严重时发送电子邮件。

Configure when a rule is triggered
操作变量编辑

使用默认通知消息或自定义它。您可以通过单击消息文本框上方的图标并从可用变量列表中进行选择,从而向消息中添加更多上下文。

Action variables with default SLO message

以下变量特定于此规则类型。您还可以指定所有规则共有的变量

context.alertDetailsUrl
指向警报故障排除视图的链接,以获取更多上下文和详细信息。如果未配置server.publicBaseUrl,则这将是一个空字符串。
context.burnRateThreshold
烧毁率阈值。
context.longWindow
具有关联烧毁率值的窗口持续时间。
context.reason
对警报原因的简要说明。
context.shortWindow
具有关联烧毁率值的窗口持续时间。
context.sloId
SLO 唯一标识符。
context.sloInstanceId
SLO 实例 ID。
context.sloName
SLO 名称。
context.timestamp
检测到警报的时间戳。
context.viewInAppUrl
指向 SLO 详细信息页面的 URL,以帮助进一步调查。
警报恢复编辑

要在警报恢复时接收通知,请选择恢复时运行。使用默认通知消息或自定义它。您可以通过单击消息文本框上方的图标并从可用变量列表中进行选择,从而向消息中添加更多上下文。

Default recovery message for Uptime duration anomaly rules with open "Add variable" popup listing available action variables
后续步骤编辑

了解如何查看警报和对 SLO 烧毁率违规进行分类