创建服务级别目标 (SLO) 消耗率规则

编辑

创建服务级别目标 (SLO) 消耗率规则

编辑

要创建和管理 SLO,您需要合适的许可证,并且必须配置SLO 访问权限

您可以创建一个 SLO 消耗率规则,以便在两个不同的回溯周期内消耗率超过定义的阈值时获得警报:一个较长的周期和一个较短的周期(较长周期的 1/12)。例如,如果您的较长回溯周期为一小时,则您的较短回溯周期为五分钟。

对于每个回溯周期,消耗率计算为错误率除以错误预算。当两个周期的消耗率都超过阈值时,将触发警报。

当您使用 UI 创建 SLO 时,将自动创建一个默认的 SLO 消耗率警报规则。消耗率规则将使用默认配置,且没有连接器。如果您想接收 SLO 违规警报,则必须配置连接器。

要创建 SLO 消耗率规则,请转至可观测性 → SLO。单击您要为其添加消耗率规则的 SLO 右侧的更多选项图标,然后从下拉菜单中选择创建新的警报规则

create new alert rule menu

创建您的 SLO 消耗率规则

  1. 回溯周期(小时)下设置您的较长回溯周期。您的较短回溯周期将自动设置。
  2. 设置您的消耗率阈值。在此字段下,您将看到在错误预算耗尽之前还有多长时间。
  3. 检查频率字段中设置条件评估的频率。
  4. 可以选择在高级选项中更改必须满足规则条件才能发生警报的连续运行次数。
操作类型
编辑

通过将规则连接到使用以下支持的内置集成的操作来扩展您的规则。操作是 Kibana 服务或与第三方系统的集成,当满足规则条件时,这些服务或集成将在 Kibana 服务器上作为后台任务运行。

您可以在设置页面上配置操作类型。

某些连接器类型是付费商业功能,而其他连接器是免费的。要比较 Elastic 订阅级别,请访问订阅页面

选择连接器后,必须设置操作频率。您可以选择在每个检查间隔或自定义间隔创建警报摘要。例如,您可以每十二小时发送一次汇总新的、正在进行的和已恢复的警报的电子邮件通知。

或者,您可以将操作频率设置为针对每个警报,并指定每个警报必须满足的操作才能运行的条件。例如,您只能在警报状态更改为严重时发送电子邮件。

Configure when a rule is triggered
操作变量
编辑

使用默认通知消息或自定义它。您可以通过单击消息文本框上方的图标并从可用变量列表中选择来向消息添加更多上下文。

Action variables with default SLO message

以下变量特定于此规则类型。您还可以指定所有规则共有的变量

context.alertDetailsUrl
指向警报故障排除视图的链接,用于提供更多上下文和详细信息。如果未配置server.publicBaseUrl,则此链接将为空字符串。
context.burnRateThreshold
消耗率阈值。
context.longWindow
具有关联消耗率值的窗口持续时间。
context.reason
警报原因的简要说明。
context.shortWindow
具有关联消耗率值的窗口持续时间。
context.sloId
SLO 唯一标识符。
context.sloInstanceId
SLO 实例 ID。
context.sloName
SLO 名称。
context.timestamp
检测到警报的时间戳。
context.viewInAppUrl
指向 SLO 详情页面的 URL,有助于进一步调查。
警报恢复
编辑

要接收警报恢复时的通知,请选择恢复时运行。使用默认通知消息或自定义它。您可以通过单击消息文本框上方的图标并从可用变量列表中选择来向消息添加更多上下文。

Default recovery message for Uptime duration anomaly rules with open "Add variable" popup listing available action variables
后续步骤
编辑

了解如何查看警报和分类 SLO 消耗率违规。