分诊阈值违规
当可观测性数据类型达到或超过您在自定义阈值规则中设置的阈值时,会发生阈值违规。例如,您可能有一个自定义阈值规则,当日志级别为error
的日志文档总数达到 100 时触发警报。
要快速分诊问题,请转到警报详情页面
- 在主菜单中找到警报,或使用全局搜索字段。
- 在“警报”表中,单击警报旁边的
图标,然后选择查看警报详情。
警报详情页面显示有关警报的信息,包括警报触发时间、警报持续时间以及上次状态更新。如果规则中指定了“分组依据”字段,则页面还会包含源。您可以点击链接导航到规则定义。
浏览页面上的图表以了解有关阈值违规的更多信息
每个条件的图表。该页面包含规则中指定的每个条件的图表。这些图表可帮助您了解违规发生的时间及其严重程度。
提示时间线已进行注释,以显示阈值何时被违反。您可以将鼠标悬停在警报图标上以查看警报的时间戳。
日志速率分析图表。如果您的规则旨在检测日志阈值违规(即,它具有使用计数聚合的单个条件),则您可以运行日志速率分析,前提是您拥有所需的许可证。运行日志速率分析有助于检测日志数量的显着下降或峰值。请注意,您可以调整基线和偏差,然后再次运行分析。有关使用日志速率分析功能的更多信息,请参阅AIOps Labs文档。
警报历史记录图表。下一个图表提供有关过去 30 天内相同规则和组的警报的信息。它显示了每天触发的那些警报的数量、整个 30 天内触发的警报总数以及违规后恢复的平均时间。
分析这些图表以更好地了解违规开始的时间、当前状态以及问题的发展趋势。
调查警报后,您可能想要
- 单击暂停规则以在特定时间段内或无限期地暂停通知。
- 单击
图标并选择添加到案例以将警报添加到新的或现有的案例。要了解更多信息,请参阅案例。
- 单击
图标,然后选择标记为未跟踪。当警报被标记为未跟踪时,将不再生成操作。禁用或删除规则时,您可以选择将活动警报移动到此状态。