创建服务级别目标 (SLO) 燃尽率规则

编辑

创建服务级别目标 (SLO) 燃尽率规则

编辑

要创建和管理 SLO,您需要一个适当的许可证、一个同时具有 transformingest 节点角色的 Elasticsearch 集群,并且必须配置 SLO 访问权限

您可以创建一个 SLO 燃尽率规则,以便在燃尽率高于为两个不同回溯期定义的阈值时收到警报:一个长期和一个短期,短期是长期的 1/12。例如,如果您的长期回溯期为一小时,则短期回溯期为五分钟。

对于每个回溯期,燃尽率计算为错误率除以错误预算。当两个周期的燃尽率都超过阈值时,将触发警报。

当您使用 UI 创建 SLO 时,会自动创建一个默认的 SLO 燃尽率警报规则。燃尽率规则将使用默认配置,并且不使用连接器。如果您想接收 SLO 违规的警报,则必须配置连接器。

要创建 SLO 燃尽率规则,请转到 可观测性 → SLO。单击要为其添加燃尽率规则的 SLO 右侧的更多选项图标,然后从下拉菜单中选择 创建新警报规则

create new alert rule menu

创建 SLO 燃尽率规则:

  1. 回溯期(小时)下设置您的长期回溯期。您的短期回溯期会自动设置。
  2. 设置您的 燃尽率阈值。在此字段下,您将看到您的错误预算耗尽之前还有多长时间。
  3. 检查频率 字段中设置条件评估的频率。
  4. 或者,可以在 高级选项 中更改在发生警报之前必须满足规则条件的连续运行次数。
操作类型
编辑

通过将规则连接到使用以下支持的内置集成的操作来扩展规则。操作是 Kibana 服务或与第三方系统的集成,当满足规则条件时,这些操作作为 Kibana 服务器上的后台任务运行。

您可以在设置页面上配置操作类型。

某些连接器类型是付费的商业功能,而其他类型是免费的。要比较 Elastic 订阅级别,请转到订阅页面

选择连接器后,您必须设置操作频率。您可以选择在每个检查间隔或自定义间隔上创建警报摘要。例如,您可以每十二小时发送一次电子邮件通知,其中概述新的、正在进行的和已恢复的警报。

或者,您可以将操作频率设置为 针对每个警报,并指定每个警报必须满足的条件才能运行操作。例如,您可以仅在警报状态更改为严重时才发送电子邮件。

Configure when a rule is triggered
操作变量
编辑

使用默认的通知消息或自定义它。您可以通过单击消息文本框上方的图标并从可用变量列表中进行选择,向消息添加更多上下文。

Action variables with default SLO message

以下变量是此规则类型特有的。您还可以指定 所有规则通用的变量

context.alertDetailsUrl
指向警报故障排除视图的链接,以获取更多上下文和详细信息。如果未配置 server.publicBaseUrl,则这将是一个空字符串。
context.burnRateThreshold
燃尽率阈值。
context.longWindow
具有相关燃尽率值的窗口持续时间。
context.reason
警报原因的简明描述。
context.shortWindow
具有相关燃尽率值的窗口持续时间。
context.sloId
SLO 唯一标识符。
context.sloInstanceId
SLO 实例 ID。
context.sloName
SLO 名称。
context.timestamp
检测到警报的时间戳。
context.viewInAppUrl
指向 SLO 详细信息页面的 URL,以帮助进行进一步调查。
警报恢复
编辑

要在警报恢复时收到通知,请选择 恢复时运行。使用默认的通知消息或自定义它。您可以通过单击消息文本框上方的图标并从可用变量列表中进行选择,向消息添加更多上下文。

Default recovery message for Uptime duration anomaly rules with open "Add variable" popup listing available action variables
后续步骤
编辑

了解如何查看警报和分类 SLO 燃尽率违规