Kibana 告警

编辑

Elastic Stack 监控功能提供了开箱即用的告警规则,以便在 Elastic Stack 中出现潜在问题时通知您。这些规则是根据 Elastic 推荐的最佳实践预先配置的。但是,您可以根据您的特定需求进行定制。

Kibana alerting notifications in Stack Monitoring

当您首次打开堆栈监控时,系统会要求您确认创建这些默认规则。它们最初配置为检测和通知您监控的集群中的各种情况。您可以查看以下内容的通知:集群健康状况资源利用率以及 Elasticsearch 的错误和异常,均为实时数据。

堆栈监控的默认基于 Watcher 的“集群告警”已在 Kibana 告警功能中重新创建为规则。因此,现有的 Watcher 电子邮件操作 monitoring.cluster_alerts.email_notifications.email_address 不再起作用。所有堆栈监控规则的默认操作是写入 Kibana 日志并在 UI 中显示通知。

要查看和修改现有的堆栈监控规则,请单击集群概览页面上的进入设置模式。或者,要管理所有规则(包括创建和删除功能),请转到堆栈管理 > 规则

CPU 使用率阈值

编辑

此规则检查运行 CPU 负载持续偏高的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟的平均值达到 85% 或更高。默认规则以 1 分钟的计划时间进行检查,并以 1 天的重新通知间隔进行通知。

磁盘使用率阈值

编辑

此规则检查磁盘容量即将耗尽的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟的平均值达到 80% 或更高。默认规则以 1 分钟的计划时间进行检查,并以 1 天的重新通知间隔进行通知。

JVM 内存阈值

编辑

此规则检查使用大量 JVM 内存的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟的平均值达到 85% 或更高。默认规则以 1 分钟的计划时间进行检查,并以 1 天的重新通知间隔进行通知。

缺少监控数据

编辑

此规则检查停止发送监控数据的 Elasticsearch 节点。默认情况下,条件设置为在过去 1 天内丢失 15 分钟。默认规则以 1 分钟的计划时间进行检查,并以 6 小时的重新通知间隔进行通知。

线程池拒绝(搜索/写入)

编辑

此规则检查经历线程池拒绝的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟内达到 300 或更多。默认规则以 1 分钟的计划时间进行检查,并以 1 天的重新通知间隔进行通知。可以为 搜索写入 类型拒绝独立设置阈值。

CCR 读取异常

编辑

此规则检查任何复制的 Elasticsearch 集群上的读取异常。如果在过去一小时内检测到 1 个或多个读取异常,则满足条件。默认规则以 1 分钟的计划时间进行检查,并以 6 小时的重新通知间隔进行通知。

大型分片大小

编辑

此规则检查 Elasticsearch 集群中任何指定数据视图上(跨关联的主分片)的较大平均分片大小。如果索引的平均分片大小在过去 5 分钟内达到 55 GB 或更高,则满足条件。默认规则匹配 -.* 的模式,并以 1 分钟的计划时间进行检查,并以 12 小时的重新通知间隔进行通知。

集群告警

编辑

这些规则检查您的 Elastic Stack 的当前状态。您可以深入查看指标,以查看有关您的集群和特定节点、实例和索引的更多信息。

如果在最后一分钟内满足以下任何条件,则会触发操作

  • Elasticsearch 集群运行状况状态为黄色(至少缺少一个副本)或红色(至少缺少一个主分片)。
  • Elasticsearch 版本不匹配。您的同一集群中存在具有不同版本的 Elasticsearch 节点。
  • Kibana 版本不匹配。您有针对同一 Elasticsearch 集群运行的不同版本的 Kibana 实例。
  • Logstash 版本不匹配。您有向同一监控集群报告统计信息的不同版本的 Logstash 节点。
  • Elasticsearch 节点已更改。您最近添加或删除了 Elasticsearch 节点。
  • Elasticsearch 许可证即将到期。集群的许可证即将到期。

    如果您在升级 Kibana 或 Logstash 节点时未保留数据目录,则该实例会被分配一个新的持久 UUID,并显示为新实例。

  • 订阅许可证即将到期。当到期日期临近时,您将收到通知,其严重级别与到期日期临近的程度相关

    • 60 天:信息警报
    • 30 天:低级别警报
    • 15 天:中级别警报
    • 7 天:严重级别警报

      试用许可证仅有效期为 30 天,因此会跳过 60 天和 30 天阈值。

告警和规则

编辑

创建默认规则

编辑

此选项可用于在此 Kibana 空间中创建默认规则。当您最初未选择创建这些默认规则或在规则被意外删除之后的任何时间,此选项都非常有用。

某些操作类型是订阅功能,而另一些则是免费的。有关 Elastic 订阅级别的比较,请参阅订阅页面的告警部分。