修复常见集群问题

编辑

本指南介绍了如何修复 Elasticsearch 集群中常见的错误和问题。

水位线错误
修复当数据节点磁盘空间严重不足并达到洪水级磁盘使用率水位线时发生的水位线错误。
熔断器错误
Elasticsearch 使用熔断器来防止节点耗尽 JVM 堆内存。如果 Elasticsearch 估计某个操作会超出熔断器,它将停止该操作并返回错误。
高 CPU 使用率
高 CPU 使用率的最常见原因及其解决方案。
高 JVM 内存压力
高 JVM 内存使用率会降低集群性能并触发熔断器错误。
红色或黄色集群状态
红色或黄色集群状态表示一个或多个分片丢失或未分配。这些未分配的分片会增加数据丢失的风险并降低集群性能。
拒绝请求
当 Elasticsearch 拒绝请求时,它会停止该操作并返回一个带有 429 响应码的错误。
任务队列积压
积压的任务队列会阻止任务完成,并使集群处于不健康状态。
诊断未分配的分片
分片可能未分配的原因有很多,从配置错误的分配设置到缺少磁盘空间。
故障排除不稳定的集群
节点意外退出的集群是不稳定的,并可能产生多个问题。
映射爆炸
索引或索引模式中映射字段数量过多的集群,会导致 Elasticsearch 和 Kibana 的性能查找问题。
热点
当资源利用率在节点之间分布不均匀时,Elasticsearch 中可能会出现热点。