分类阈值违规编辑

当可观测性数据类型达到或超过自定义阈值规则中设置的阈值时,就会发生阈值违规。例如,您可能有一个自定义阈值规则,当日志级别为 error 的日志文档总数达到 100 时触发警报。

要快速分类问题,请转到警报详细信息页面

  1. 转到 可观测性警报
  2. 在“警报”表中,单击警报旁边的 更多操作 图标,然后选择 查看警报详细信息

警报详细信息页面显示有关警报的信息,包括警报触发时间、警报持续时间和上次状态更新。如果规则中指定了“分组依据”字段,则页面还包括来源。您可以点击链接导航到规则定义。

浏览页面上的图表以详细了解阈值违规

Alert details for log threshold breach
  • 该页面包含规则中指定的每个条件的图表。这些图表可帮助您了解违规发生的时间及其严重程度。
  • 如果您的规则旨在检测日志阈值违规(即,它具有使用计数聚合的单个条件),则您可以运行日志速率分析,前提是您拥有所需的许可证。运行日志速率分析有助于检测日志数量的显著下降或峰值。请注意,您可以调整基线和偏差,然后再次运行分析。有关使用日志速率分析功能的更多信息,请参阅AIOps 实验室文档。
  • 该页面还可能包含一个警报历史记录图表,该图表显示了过去 30 天每天触发的警报数量。此图表当前仅适用于指定单个条件的规则。
  • 页面上的时间线带有注释,以显示阈值何时被突破。您可以将鼠标悬停在警报图标上以查看警报的时间戳。

分析这些图表,以更好地了解违规何时开始、其当前状态以及问题的趋势。

调查警报后,您可能需要

  • 单击 暂停规则 以在特定时间段内或无限期地暂停通知。
  • 单击 操作 图标,然后选择 添加到案例 以将警报添加到新的或现有的案例中。要了解更多信息,请参阅案例
  • 单击 操作 图标,然后选择 标记为未跟踪。当警报被标记为未跟踪时,将不再生成操作。当您禁用或删除规则时,您可以选择将活动警报移动到此状态。