New

The executive guide to generative AI

Read more

诊断 SLO 燃尽率违规

编辑

当指定时间段内的不良事件百分比超过您在 SLO 燃尽率规则中设置的阈值时,就会发生 SLO 燃尽率违规。发生这种情况时,您有耗尽错误预算并违反 SLO 的风险。

要快速诊断问题,请转到告警详情页面

  1. 打开 SLO 并单击 告警
  2. 在告警表中,单击告警旁边的更多操作 图标,然后选择 查看告警详情

告警详情页面显示有关告警的信息,包括告警触发时间、告警持续时间、源 SLO 和触发告警的规则。您可以单击链接导航到源 SLO 或规则定义。

浏览页面上的图表以了解有关 SLO 违规的更多信息

  • 燃尽率图表。第一个图表显示告警处于活动状态的时间范围内的燃尽率。该线表示 SLO 接近突破阈值的程度。

    Alert details for SLO burn rate breach

    时间轴会进行注释,以显示何时突破阈值。您可以将鼠标悬停在告警图标上,以查看告警的时间戳。

  • 告警历史图表。下一个图表提供有关过去 30 天内同一规则和组的告警信息。它显示每天触发的告警数量、整个 30 天内触发的告警总数以及违规后恢复的平均时间。

    Alert history chart in alert details for SLO burn rate breach

这些违规的次数、持续时间和频率会指示服务的降级程度,以便您可以优先关注高严重性问题。

告警详情页面的内容可能因 SLO 中定义的 SLI 类型而异。

在调查告警后,您可能需要

  • 单击 暂停规则 以在特定时间段或无限期暂停通知。
  • 单击 操作 图标并选择 添加到案例 以将告警添加到新的或现有案例。要了解更多信息,请参阅 案例
  • 单击 操作 图标并选择 标记为未跟踪。当告警被标记为未跟踪时,将不再生成操作。您可以在禁用或删除规则时选择将活动告警移动到此状态。
Was this helpful?
Feedback