阈值违规的分类

编辑

当可观察性数据类型达到或超过您在自定义阈值规则中设置的阈值时,就会发生阈值违规。例如,您可能有一个自定义阈值规则,当日志级别为error的日志文档总数达到 100 时触发警报。

要快速分类问题,请转到警报详细信息页面

  1. 在主菜单中找到警报,或使用全局搜索字段
  2. 在警报表中,单击警报旁边的更多操作图标,然后选择查看警报详细信息

警报详细信息页面显示有关警报的信息,包括警报触发时间、警报持续时间和上次状态更新。如果规则中指定了“分组依据”字段,则该页面还包括源。您可以单击链接导航到规则定义。

浏览页面上的图表以了解有关阈值违规的更多信息

  • 每个条件的图表。该页面包括规则中指定的每个条件的图表。这些图表可帮助您了解违规发生的时间及其严重程度。

    Chart for a condition in alert details for log threshold breach

    时间轴已进行注释,以显示何时发生阈值违规。您可以将鼠标悬停在警报图标上以查看警报的时间戳。

  • 日志速率分析图表。如果您的规则旨在检测日志阈值违规(即,它具有使用计数聚合的单个条件),则可以运行日志速率分析,前提是您具有所需的许可证。运行日志速率分析对于检测日志数量的显著下降或飙升非常有用。请注意,您可以调整基线和偏差,然后再次运行分析。有关使用日志速率分析功能的更多信息,请参阅AIOps 实验室文档。

    Log rate analysis chart in alert details for log threshold breach
  • 警报历史记录图表。下一个图表提供了有关过去 30 天内同一规则和组的警报的信息。它显示每天触发的警报数量、30 天内触发的警报总数以及违规后恢复的平均时间。

    Alert history chart in alert details for log threshold breach

分析这些图表,以更好地了解违规开始的时间、当前状态以及问题的发展趋势。

调查警报后,您可能需要

  • 单击暂停规则以暂停在特定时间段或无限期地暂停通知。
  • 单击操作图标,然后选择添加到案例以将警报添加到新案例或现有案例。要了解更多信息,请参阅案例
  • 单击操作图标,然后选择标记为未跟踪。当警报被标记为未跟踪时,将不再生成操作。当您禁用或删除规则时,可以选择将活动警报移动到此状态。