服务级别目标 (SLO)
重要提示
SLO 允许您根据可用性、响应时间、错误率和其他关键指标等因素,为您的服务性能设置清晰、可衡量的目标。您可以根据不同类型的数据源(例如自定义 KQL 查询和 APM 延迟或可用性数据)定义 SLO。
定义 SLO 后,您可以实时监控它们,通过详细的仪表板和警报,帮助您快速识别和排除可能出现的任何问题。您还可以跟踪您在一段时间内针对 SLO 目标取得的进展,并清晰地了解您的错误预算和消耗率。
下表列出了一些与 SLO 相关的重要概念
服务级别指标 (SLI) | 对您的服务性能的衡量,例如服务延迟或可用性。 |
SLO | 您为 SLI 设置的目标。它指定您在一段时间内期望从您的服务获得的性能水平。 |
错误预算 | 在 SLI 未能达到 SLO 目标之前,可以违反 SLO 的时间量。 |
消耗率 | 您的服务消耗错误预算的速度。 |
除了与 SLO 功能相关的这些关键概念之外,请参阅了解 SLO 内部机制,以获取有关 SLO 如何工作及其与其他系统组件(例如Elasticsearch Transforms)的关系的更多信息。
从 SLO 概览中,您可以查看所有 SLO 以及每个 SLO 中发生情况的快速摘要

从概览中选择一个 SLO 以查看其他详细信息,包括
- 消耗率:不同时间段(1 小时、6 小时、24 小时、72 小时)内的不良事件百分比以及在这些时间段内耗尽错误预算的风险。
- 历史 SLI:SLI 值以及它在 SLO 时间窗口内的趋势。
- 错误预算消耗:剩余错误预算以及它在 SLO 时间窗口内的趋势。
- 警报:如果您为 SLO 设置了任何SLO 消耗率警报规则,则会显示活动警报。

您可以应用搜索和过滤器来快速找到您感兴趣的 SLO。

- 应用结构化过滤器:在搜索字段旁边,单击添加过滤器
图标以添加自定义过滤器。请注意,您可以使用
OR
和AND
来组合过滤器。结构化过滤器可以被禁用、反转或固定到所有应用程序中。 - 输入半结构化搜索:在搜索字段中,开始键入字段名称以获取字段名称和运算符的建议,您可以使用这些建议来构建结构化查询。半结构化搜索将过滤 SLO 以查找匹配项,并且仅返回匹配的 SLO。
- 使用 状态 和 标签 菜单根据状态或定义的标签包含或排除视图中的 SLO。
还可以选择对概览中显示的 SLO 进行排序和分组

- 排序方式:SLI 值、SLO 状态、已消耗的错误预算或剩余的错误预算。
- 分组方式:无、标签、状态或 SLI 类型。
- 单击图标以在卡片视图 (
)、列表视图 (
) 或紧凑视图 (
) 之间切换。
SLO 数据也可以作为仪表板面板使用。面板允许您管理自定义数据视图和可视化效果,从而清晰地了解您的数据。
可用的 SLO 面板包括
- SLO 概览:可视化选定的 SLO 的运行状况,包括名称、当前 SLI 值、目标和状态。
- SLO 警报:可视化一个或多个 SLO 警报,包括状态、规则名称、持续时间和原因。此外,可以直接从面板配置和更新警报,或创建案例。

要了解有关仪表板的更多信息,请参阅仪表板。
从 8.12.0 版本开始,SLO 通常可用 (GA)。如果您是从 SLO 的 Beta 版本(8.11.0 及更早版本中可用)升级,则必须将 SLO 定义迁移到新格式。
请参阅从 Beta 版升级到 GA 版。
开始使用 SLO 来衡量您的服务性能