虽然 Elasticsearch 是一款功能强大的可扩展搜索引擎,提供了丰富的功能选择,但许多用户发现它具有挑战性,因为它有时会带来复杂的管理体验。我们听到了您的声音,并且很高兴分享一些重大新闻!Opster 团队一直在努力改进 AutoOps,并将其无缝融入 Elastic 平台。AutoOps 现已在 选定 Elastic Cloud 区域提供,并且覆盖范围正在快速扩大!
AutoOps 使 Elastic Cloud 易于操作
面向 Elasticsearch 的 AutoOps 通过性能建议、资源利用率和成本洞察、实时问题检测和解决路径,显著简化了集群管理。使用 AutoOps,您将能够
- 通过针对您的 Elasticsearch 利用率和配置量身定制的见解,最大程度地减少管理时间
- 使用预配置警报实时分析数百个 Elasticsearch 指标,以在问题变得严重之前检测和标记问题
- 获取根本原因分析,并深入了解问题发生的特定时间点,以及包括 Elasticsearch 命令在内的解决建议
- 通过提供优化建议来提高资源利用率
在以下每个场景中,让我们看看用户可能会遇到的问题示例,以及 AutoOps 洞察(屏幕截图)如何立即提供帮助!
真实场景:AutoOps 如何使 Elasticsearch 易于操作
以下场景提供了现实世界中的问题以及 AutoOps 如何提供根本原因分析,并深入了解问题发生的特定时间点,以及如何解决问题的建议。
场景 #1:查找导致严重搜索延迟的查询
问题
用户抱怨他们的仪表板速度很慢,加载时间很长……
AutoOps 洞察
AutoOps 报告了一个“长时间运行的搜索任务”事件,识别了一个运行了 4 分钟并包含 4 个嵌套聚合的搜索,并建议了优化导致延迟的查询的方法。
解决方法
AutoOps 提供了一个 cURL 命令来取消查询。通过识别和取消长时间运行的搜索任务,管理员能够阻止此特定查询。
AutoOps 监控任务管理 API 并标记长时间运行的搜索任务,提供了一种简单的方法来检测长时间运行的搜索查询并对其进行优化
AutoOps 提供上下文相关的 Elasticsearch 命令来解决问题,例如取消长时间运行的搜索任务
场景 #2:数据分层使用效率低下,导致搜索和索引速度缓慢
问题
用户报告搜索性能和索引速度缓慢。
AutoOps 洞察
AutoOps 检测到多个问题,这些问题源于由于在热节点上进行索引活动而导致的负载增加,从而导致索引队列过高以及这些节点之一上的搜索速度缓慢。
AutoOps 检测到索引活动正在热节点上进行,索引队列过高,并且在一个热节点上检测到搜索速度缓慢。
解决方法
团队更新了他们的 ILM 策略,以确保索引仅在不再预期任何进一步的索引活动时才从热层移动。
AutoOps 检测到在热层进行了索引
AutoOps 检测到索引队列过高,并提供了解决方案建议列表
AutoOps 搜索性能缓慢事件 - 检测到加载节点上的搜索性能缓慢
场景 #3:调查生产停机时间
问题
报告了一个中断,并且集群上的 CPU 使用率暂时很高
AutoOps 洞察
AutoOps 识别了 CPU 利用率较高的时段,并提供了对问题发生时间点的深入分析,以及检查慢日志的建议。进一步深入节点视图显示 CPU 每天大约在早上 7 点都很高。
解决方法
SRE 找到一个计划每天早上 7 点运行的脚本,通过修改该脚本,他们能够修复问题并稳定集群。
AutoOps 提供超链接以快速深入了解检测到的问题
深入分析屏幕提供了额外的上下文,其中包含有关节点、索引和分片以及模板优化的指标
场景 #4:客户 Kibana 仪表板速度缓慢
问题
客户抱怨 Kibana 仪表板有时比平时慢
AutoOps 洞察
AutoOps 检测到可能导致搜索性能缓慢的大型分片,并建议重新索引到较小的索引中并查看 ILM 策略。
解决方法
团队按照 AutoOps 的建议更改了分片大小,从而提高了仪表板的响应速度和集群稳定性。
AutoOps 监控分片大小,并在何时以及如何优化分片时发出警报
AutoOps 和 Elastic:还有什么组合比它们更经典!
通过分析数百个 Elasticsearch 指标、您的配置和使用模式,AutoOps 会推荐运营和监控见解,从而在管理时间和硬件成本方面带来真正的节省。
Elasticsearch 性能优化:AutoOps 会准确告诉您如何保持 Elasticsearch 集群平稳运行。它根据您的特定使用情况和配置提供量身定制的见解,帮助您保持高性能。
Elasticsearch 特定问题的实时问题检测:AutoOps 持续分析数百个 Elasticsearch 指标,并提供预配置警报,以在问题变得更大之前捕获诸如摄取瓶颈、数据结构错误配置、负载不平衡、慢查询等问题。
轻松故障排除:故障排除可能很复杂,尤其是在较大的环境中。AutoOps 执行根本原因分析,并深入了解问题发生的精确时间点,以及包括上下文相关的 Elasticsearch 命令和最佳实践在内的解决路径。
Elasticsearch 部署的成本可见性和优化:AutoOps 识别未充分利用的节点、大小索引和分片,并建议数据层优化。这有助于更好地利用资源并节省潜在的硬件成本。
无缝集成:AutoOps 不仅仅是一个独立的工具;它内置于 Elastic Cloud 中,并与警报和消息传递框架(MS Teams 和 Slack)、事件管理系统(PagerDuty 和 OpsGenie)以及其他工具集成。您可以根据您的用例自定义 AutoOps 警报和通知。
查询优化、模板优化等等!AutoOps 内置了我们在运行和管理各种类型的 Elastic 环境方面的专业知识。例如,AutoOps 会识别并向您发出有关昂贵查询、存在的数据类型以及何时应该(或不应该)使用它们的警报,例如将数字存储为整数/长整型以便它们针对范围查询进行优化。内置了许多其他类型的建议,我们希望您会发现它们很有用!
AutoOps 什么时候可以供我使用?
我们正在分阶段推出 AutoOps,首先从选定的 Elastic Cloud 托管 区域 开始,并且覆盖范围正在快速扩大。接下来,我们将重点关注 Elastic Cloud Serverless 用户。虽然 Elastic Cloud Serverless 已经使 Elasticsearch 更易于使用,但 AutoOps 将通过提供高级监控和优化功能将其提升到一个新的水平。对于我们的自管理客户,我们也没有忘记您。我们正在计划将 AutoOps 带给您!
试用 AutoOps:操作 Elasticsearch 的简便方法
Elasticsearch 功能强大,但对于您的使用也应该尽可能简单高效。借助 AutoOps,我们正在以一种重要方式兑现这一承诺。无论您是追求最佳性能还是希望降低成本,AutoOps 都可以提供见解和工具来帮助您。
有任何疑问或渴望深入了解 AutoOps?以下是一些入门方法,祝您优化愉快!