Elastic 可观察性:监控 Kubernetes 集群

概述

Elastic 可观察性简介

更深入地了解 Elastic 可观察性,以及如何使用 Elastic Cloud 摄取、查看和分析来自应用程序的客户日志的概述。


让我们开始吧

创建 Elastic Cloud 帐户

开始 14 天试用。访问 cloud.elastic.co 并创建帐户后,请观看此视频,了解如何在全球 50 多个支持的区域中启动您的第一个 Elastic 堆栈。

Create-Deployment_8.12.png

部署完成后,在 **可观察性** 选项卡下,选择 **监控 Kubernetes 集群** 并按照提供的指南操作。请务必查看此博客,了解更多关于 管理 Kubernetes 集群 的详细信息。

将您的 Kubernetes 数据导入 Elastic

如果这是您第一次使用 Elastic,您需要将 Elastic 代理添加到要监控的 Kubernetes 集群并配置 Kubernetes 集成。

选择 **监控 Kubernetes 集群** 后,单击 **开始**,系统会提示您添加 Kubernetes 集成。

选择 **添加 Kubernetes** 后,系统会提示您完成 3 个简单的步骤来摄取您的 Kubernetes 数据。

首先,您需要使用 Kubernetes 集成 添加 Elastic 代理。虽然集成预设为收集所有 Kubernetes 数据,但您可以选择仅收集所需的数据(例如,Pod 指标、容器日志等)。

有关使用 Elastic 代理的 Kubernetes 集成可以为您做什么的概述,请查看此 博客

除了标准的 Kubernetes 组件外,Elastic 代理的 Kubernetes 集成还支持从 kube-state-metrics (ksm) 收集数据,ksm 是一个广受欢迎的监控 Kubernetes 集群的补充;ksm 在大多数 Kubernetes 发行版中并非默认提供,您需要单独 安装它

有关如何在 Kubernetes 上运行 Elastic 代理的更多信息,请参阅 文档


使用 Elastic 可观察性

现在您已经从 Kubernetes 集群中获取了数据,让我们深入分析收集的日志和指标,最后设置警报,帮助您了解何时需要关注问题。

在 Elastic 可观察性上使用 Kubernetes 日志

可以在 Elastic 的 Discover 功能中搜索和分析 Kubernetes 日志。要利用 **Discover**,请导航到左侧菜单,并在 **分析** 下选择 **Discover**。

在这里,我们可以看到如何搜索、查看和分析 Kubernetes 日志

此外,我们还可以查看 Discover 中的指标

在 Elastic 可观察性上可视化 Kubernetes 指标

此外,还有各种开箱即用的 Kubernetes 仪表板,允许您在 Kibana 中分析 Kubernetes 指标。只需导航到左侧 **分析** 下的 **仪表板**,然后搜索 **Kubernetes** 即可。

如果我们查看 **Kubernetes 概述**,我们可以看到整个 Kubernetes 集群的指标。所有节点、Pod 以及 CPU 和内存使用情况。

Kibana 允许您使用交互式仪表板分析日志,以得出见解、自动化工作流程、查找异常和趋势等等。请务必探索下面的教程库,并熟悉 Kibana,以便您可以自定义或创建自己的仪表板。

选择 **分析** 下的 **仪表板** 后,您还可以创建仪表板并根据需要自定义新的开箱即用仪表板。

如果您遇到困难,请查看此 引导游览,了解如何导入数据。

了解有关 Kibana 以及创建仪表板和使用 Discover 的更多信息。

预防、预测和修复问题

设置警报

在左侧导航栏的 **可观察性** 下,接下来您需要选择 **警报** 和 **创建规则**。这将允许您在发生各种事件时(例如,延迟异常、指标聚合超过阈值等)通过电子邮件、Jira、Slack 等方式接收通知。

利用机器学习来发现见解

在开始本节之前,请确保您已将节点部署到机器学习。

最后,导航到菜单中 **分析** 下的 **机器学习**。在 **机器学习概述** 页面左侧菜单的 **异常检测** 下,选择 **作业** 以创建机器学习作业。例如,通过设置机器学习作业,您将不再需要在内存使用率达到特定百分比(例如,50%、80% 等)时发出警报,而是会知道何时使用率不正常。


后续步骤

感谢您抽出时间使用 Elastic Cloud 监控您的 Kubernetes 集群。如果您是 Elastic 的新手,请务必开始 14 天免费试用。

此外,在您开始使用 Elastic 的旅程中,请了解一些您在跨环境部署时应管理的操作、安全和数据组件

 

准备开始了吗?在 Elastic Cloud 上启动 14 天免费试用。

开始免费试用