查看告警

编辑

“告警”页面列出了所有满足您使用某个可观测性应用程序创建的规则定义的条件的告警。

告警触发后,您可以监控其活动以验证其是否正常运行。此外,您可以在各自的应用程序中过滤告警并对每个告警进行故障排除。

您还可以将告警添加到案例中,以打开和跟踪潜在的基础设施问题。

您可以从Kibana 管理 UI集中管理规则,该 UI 提供了一组内置的规则类型连接器供您使用。单击管理规则

Alerts page
过滤告警
编辑

为了帮助您更快地开始分析,请使用 KQL 栏使用Kibana 查询语言创建结构化查询。例如,kibana.alert.rule.name : <>

您可以使用时间过滤器定义特定的日期和时间范围。默认情况下,此过滤器设置为搜索过去 15 分钟。

您还可以使用 KQL 栏下方的按钮按告警状态进行过滤。默认情况下,此过滤器设置为显示全部告警,但您可以过滤以仅显示活动恢复未跟踪告警。

当规则中定义的条件当前匹配时,告警处于“活动”状态。当先前匹配的条件当前不再匹配时,告警处于“恢复”状态。当相应的规则被禁用或您将告警标记为未跟踪时,告警处于“未跟踪”状态。要将告警标记为未跟踪,请转到“告警”表,单击更多操作图标以展开“更多操作”菜单,然后单击标记为未跟踪。当告警被标记为未跟踪时,将不再生成操作。当您禁用或删除规则时,可以选择将活动告警移至此状态。

还有一个“抖动”状态,这意味着告警在活动和恢复状态之间反复切换。此状态仅在您启用了告警抖动检测时才有可能。对于每个空间,您可以选择用于确定告警是否抖动的回溯窗口和阈值。例如,在可观测性 > 告警 > 设置中,您可以指定告警必须在过去 10 次运行中至少更改状态 6 次。如果规则在告警状态更改时运行操作,则在告警抖动期间会抑制这些操作。

查看告警详细信息
编辑

有几种方法可以检查特定告警的详细信息。

在“告警”表中,您可以单击原因列中的文本以打开告警详细信息弹出窗口,以查看告警摘要,而无需离开页面。您将在那里看到告警的当前状态、持续时间以及上次更新时间。为了帮助您确定导致告警的原因,您可以查看预期和实际阈值以及生成告警的规则。

View alert details flyout on the Alerts page

要进一步检查告警

  • 在告警详细信息弹出窗口中,单击告警详细信息
  • 在“告警”表中,单击更多操作图标,然后选择查看告警详细信息

要进一步检查规则

  • 在告警详细信息弹出窗口中,单击查看规则详细信息
  • 在“告警”表中,单击更多操作图标,然后选择查看规则详细信息

要在触发告警的应用程序中查看告警

  • 在告警详细信息弹出窗口中,单击在应用程序中查看
  • 在“告警”表中,单击在应用程序中查看图标。
自定义告警表
编辑

使用告警表左上方的工具栏按钮自定义您要显示的列

  • :重新排序列。
  • x 字段排序:按一个或多个列对表进行排序。
  • 字段:选择要在表中显示的字段。

例如,单击字段并选择kibana.alert.maintenance_window_ids字段。如果告警受维护窗口的影响,则其标识符将显示在新列中

Alerts table with toolbar buttons highlighted

您还可以使用右上方的工具栏按钮自定义显示选项或以全屏模式查看表格。

将告警添加到案例
编辑

在“告警”表中,您可以将一个或多个告警添加到案例中。单击更多操作图标以将告警添加到新的或现有的案例中。

每个案例最多可以包含 1,000 个告警。

将告警添加到新案例
编辑

要将告警添加到新案例

  1. 选择添加到新案例
  2. 输入案例名称、添加相关标签并包含案例描述。
  3. 外部事件管理系统下,选择连接器。如果您之前添加过连接器,则该连接器将显示为默认选择。否则,默认设置为未选择连接器。
  4. 完成所有必填字段后,单击创建案例。系统将显示一条通知消息,确认您已成功创建案例。要查看案例详细信息,请单击通知链接或转到案例页面。
将告警添加到现有案例
编辑

要将告警添加到现有案例

  1. 选择添加到现有案例
  2. 在“选择案例”窗格中,选择要附加告警的案例。系统会显示一条确认消息,并提供查看更新后的案例的选项。要查看案例详细信息,请单击通知链接或转到案例页面。