创建和管理规则
注意
对于可观测性无服务器项目,需要编辑器角色或更高级别的角色才能创建和管理警报规则。如需了解更多信息,请参阅 分配用户角色和权限。
警报使您能够定义规则,这些规则可以检测不同应用中的复杂条件,并在满足这些条件时触发操作。警报提供了一组内置的连接器和规则供您使用。
了解更多关于可观测性规则以及如何创建它们
| 规则类型 | 名称 | 检测到... |
|---|---|---|
| AIOps | 异常检测 | 异常值匹配特定条件。 |
| APM | APM 异常 | 服务的延迟、吞吐量或失败事务率异常。 |
| 可观测性 | 自定义阈值 | 可观测性数据类型达到或超过给定值。 |
| Stack | Elasticsearch 查询 | 在最近一次查询运行时找到匹配项。 |
| APM | 错误计数阈值 | 服务中的错误数量超过定义阈值。 |
| APM | 失败事务率阈值 | 服务中的事务错误率超过定义阈值。 |
| 指标 | 清单 | 基础设施清单超过定义阈值。 |
| 日志 | 日志阈值 | 可观测性数据类型达到或超过给定值。 |
| 指标 | 指标阈值 | 可观测性数据类型达到或超过给定值。 |
| APM | 延迟阈值 | 服务中特定事务类型的延迟超过定义阈值。 |
| SLO | SLO 耗尽率规则 | 耗尽率高于定义阈值。 |
您首先定义规则及其评估频率。您可以扩展这些规则,添加适当的操作(例如,发送电子邮件或创建问题)以在满足规则条件时触发。这些操作在每个规则内定义,并由相应操作的连接器(例如 Slack、Jira)实现。您可以在“管理规则”页面上从头开始创建任何规则,或者从各自的 UI 创建特定规则类型,并受益于预填充的一些详细信息(例如,名称和标签)。
- 对于 APM 警报类型,您可以选择“警报和规则”,并直接从“服务”、“跟踪”和“依赖项” UI 创建规则。
- 对于 SLO 警报类型,从“SLO”页面打开 SLO 的“更多操作”菜单
,然后选择“创建新警报规则”。或者,当您创建新的 SLO 时,“创建新的 SLO 耗尽率警报规则”复选框默认启用,并在保存 SLO 后提示您 创建 SLO 耗尽率规则。
创建规则后,您可以打开“更多操作”菜单 ,然后选择“编辑规则”来检查或更改定义,以及/或添加或修改操作。
从操作菜单中,您还可以
- 禁用或删除规则
- 克隆规则
- 暂定规则通知
- 运行规则(无需等待下一次计划检查)
- 更新 API 密钥
在“规则”页面上点击单个规则可查看详情,包括规则名称、状态、定义、执行历史、相关警报等。
规则可以有以下响应之一
失败- 规则运行出错。
成功- 规则运行无误。
warning- 规则运行出现一些非关键性错误。
规则列表使您可以快速暂定、禁用、启用或删除单个规则。
当您暂定规则时,规则检查将继续按计划运行,但警报不会触发任何操作。您可以指定一个时间段、永久地暂定,或安排单次或重复性停机。
当规则处于暂定状态时,您可以取消或更改此状态的持续时间。
要临时抑制所有规则的通知,请创建 维护窗口。
要导入和导出规则,请使用 保存的对象。
导出时规则会被禁用。导入成功后会提示您重新启用规则。