Kibana 警报
编辑Kibana 警报编辑
Elastic Stack 监控功能提供开箱即用的 警报规则,以便在 Elastic Stack 中出现潜在问题时通知您。这些规则是根据 Elastic 建议的最佳实践预先配置的。但是,您可以根据自己的特定需求对其进行定制。
首次打开 堆栈监控 时,系统会要求您确认是否创建这些默认规则。这些规则最初配置为跨受监控集群检测各种情况并发出通知。您可以实时查看以下内容的通知:集群运行状况、资源利用率 以及 Elasticsearch 的 错误和异常。
堆栈监控的默认基于 Watcher 的“集群警报”已在 Kibana 警报功能中重新创建为规则。因此,现有的 Watcher 电子邮件操作 monitoring.cluster_alerts.email_notifications.email_address
不再有效。所有堆栈监控规则的默认操作是写入 Kibana 日志并在 UI 中显示通知。
要查看和修改现有的 堆栈监控 规则,请在 集群概览 页面上单击 进入设置模式。或者,要管理所有规则(包括创建和删除功能),请转到 堆栈管理 > 规则。
CPU 使用率阈值编辑
此规则检查 CPU 负载持续较高的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟内平均值达到或超过 85%。默认规则以 1 分钟的计划时间进行检查,重新通知间隔为 1 天。
磁盘使用率阈值编辑
此规则检查磁盘容量接近饱和的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟内平均值达到或超过 80%。默认规则以 1 分钟的计划时间进行检查,重新通知间隔为 1 天。
JVM 内存阈值编辑
此规则检查使用大量 JVM 内存的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟内平均值达到或超过 85%。默认规则以 1 分钟的计划时间进行检查,重新通知间隔为 1 天。
缺少监控数据编辑
此规则检查停止发送监控数据的 Elasticsearch 节点。默认情况下,条件设置为回溯 1 天,缺少 15 分钟。默认规则以 1 分钟的计划时间进行检查,重新通知间隔为 6 小时。
线程池拒绝(搜索/写入)编辑
此规则检查遇到线程池拒绝的 Elasticsearch 节点。默认情况下,条件设置为过去 5 分钟内达到或超过 300 次。默认规则以 1 分钟的计划时间进行检查,重新通知间隔为 1 天。可以为 search
和 write
类型的拒绝分别设置阈值。
CCR 读取异常编辑
此规则检查任何复制的 Elasticsearch 集群上的读取异常。如果在过去一小时内检测到 1 个或多个读取异常,则满足条件。默认规则以 1 分钟的计划时间进行检查,重新通知间隔为 6 小时。
分片大小过大编辑
此规则检查 Elasticsearch 集群中任何指定数据视图上的平均分片大小(跨关联主分片)是否过大。如果索引的平均分片大小在过去 5 分钟内达到或超过 55GB,则满足条件。默认规则匹配 -.*
的模式,以 1 分钟的计划时间运行检查,重新通知间隔为 12 小时。
集群警报编辑
这些规则检查 Elastic Stack 的当前状态。您可以深入了解指标,以查看有关集群以及特定节点、实例和索引的更多信息。
如果在最后一分钟内满足以下任何条件,则会触发操作
- Elasticsearch 集群运行状况状态为黄色(缺少至少一个副本)或红色(缺少至少一个主分片)。
- Elasticsearch 版本不匹配。您在同一个集群中拥有不同版本的 Elasticsearch 节点。
- Kibana 版本不匹配。您有不同版本的 Kibana 实例针对同一个 Elasticsearch 集群运行。
- Logstash 版本不匹配。您有不同版本的 Logstash 节点向同一个监控集群报告统计信息。
- Elasticsearch 节点已更改。您有最近添加或删除的 Elasticsearch 节点。
-
Elasticsearch 许可证即将到期。集群的许可证即将到期。
如果您在升级 Kibana 或 Logstash 节点时未保留数据目录,则该实例将被分配一个新的持久 UUID,并显示为新实例。
-
订阅许可证即将到期。当接近到期日期时,您将收到严重性级别与到期日期临近程度相关的通知
- 60 天:信息性警报
- 30 天:低级别警报
- 15 天:中等级别警报
-
7 天:严重级别警报
试用许可证跳过 60 天和 30 天的阈值,因为试用许可证的有效期仅为 30 天。
警报和规则编辑
创建默认规则编辑
此选项可用于在此 Kibana 空间中创建默认规则。如果您最初没有选择创建这些默认规则,或者如果规则被意外删除,则此选项很有用。
某些操作类型是订阅功能,而其他操作类型是免费的。有关 Elastic 订阅级别的比较,请参阅 订阅页面 的警报部分。