修复常见的集群问题
编辑修复常见的集群问题编辑
本指南介绍如何修复 Elasticsearch 集群中常见的错误和问题。
- 水位线错误
- 修复当数据节点磁盘空间严重不足且已达到洪水阶段磁盘使用水位线时发生的错误。
- 断路器错误
- Elasticsearch 使用断路器来防止节点耗尽 JVM 堆内存。如果 Elasticsearch 估计操作会超过断路器,它会停止操作并返回错误。
- 高 CPU 使用率
- 高 CPU 使用率的最常见原因及其解决方案。
- 高 JVM 内存压力
- 高 JVM 内存使用率会降低集群性能并触发断路器错误。
- 红色或黄色集群状态
- 红色或黄色集群状态表示一个或多个分片丢失或未分配。这些未分配的分片会增加数据丢失的风险,并可能降低集群性能。
- 拒绝请求
- 当 Elasticsearch 拒绝请求时,它会停止操作并返回带有
429
响应代码的错误。 - 任务队列积压
- 积压的任务队列会阻止任务完成,并将集群置于不健康状态。
- 诊断未分配分片
- 分片未分配的原因有很多,从配置错误的分配设置到磁盘空间不足。
- 故障排除不稳定的集群
- 节点意外离开的集群是不稳定的,会导致多个问题。
- 映射爆炸
- 在集群中,索引或索引模式因映射字段数量过多而爆炸,这会导致 Elasticsearch 和 Kibana 的性能查找问题。
- 热点
- 当资源利用率在节点之间分布不均匀时,Elasticsearch 中可能会出现热点。