Elastic 可观测性:监控 Kubernetes 集群
概述
Elastic 可观测性简介
更熟悉 Elastic 可观测性,以及如何使用 Elastic Cloud 提取、查看和分析来自您的应用程序的客户日志的概述。
让我们开始吧
创建一个 Elastic Cloud 帐户
开始 14 天的试用。访问 cloud.elastic.co 并创建帐户后,请观看此视频,了解如何在我们在全球支持的 50 多个区域中的任何一个区域启动您的第一个 Elastic Stack。
部署完成后,在“可观测性”选项卡下,选择“监控 Kubernetes 集群”并按照提供的指南进行操作。请务必查看此博客,了解有关管理 Kubernetes 集群的更多详细信息。

将您的 Kubernetes 数据导入 Elastic
如果这是您第一次使用 Elastic,您需要将一个 Elastic 代理添加到要监控的 Kubernetes 集群,并配置 Kubernetes 集成。
选择“监控 Kubernetes 集群”后,单击“开始”,系统会提示您添加 Kubernetes 集成。

当您选择“添加 Kubernetes”时,系统会提示您执行 3 个简单的步骤来提取 Kubernetes 数据。
首先,您将使用 Kubernetes 集成添加 Elastic 代理。虽然该集成预设为收集所有 Kubernetes 数据,但您可以选择仅收集您想要的内容(即,Pod 指标、容器日志等)。
有关使用 Elastic Agent 的 Kubernetes 集成可以为您做些什么的高级概述,请查看此博客。
除了标准的 Kubernetes 组件之外,Kubernetes 的 Elastic Agent 集成还支持从 kube-state-metrics (ksm) 收集数据,ksm 是一个用于监控 Kubernetes 集群的广受欢迎的附加组件;ksm 不是大多数 Kubernetes 发行版的默认配置,您需要单独安装它。
有关如何在 Kubernetes 上运行 Elastic 代理的更多信息,请参阅文档。
使用 Elastic 可观测性
现在您已经有来自 Kubernetes 集群的数据,让我们深入分析收集的日志和指标,最后设置警报以帮助您了解何时需要关注问题。
使用 Elastic 可观测性处理 Kubernetes 日志
可以在 Elastic 的“发现”功能中搜索和分析 Kubernetes 日志。要利用“发现”,请导航到左侧菜单并选择“分析”下的“发现”。
在这里,我们看到如何搜索、查看和分析 Kubernetes 日志
此外,我们还可以在发现中查看指标
在 Elastic 可观测性上可视化 Kubernetes 指标
此外,还有各种开箱即用的 Kubernetes 仪表板,允许您在 Kibana 中分析 Kubernetes 指标。只需导航到左侧“分析”下的“仪表板”,然后搜索“Kubernetes”。
如果我们查看“Kubernetes 概述”,我们可以看到整个 Kubernetes 集群的指标。所有节点、Pod 以及 CPU 和内存使用情况。
Kibana 允许您使用交互式仪表板分析日志以获得见解、自动化工作流程、查找异常和趋势等等。请务必浏览下面的教程库,并熟悉 Kibana,以便您可以自定义或创建自己的仪表板。
当您选择“分析”下的“仪表板”时,您还可以创建仪表板并根据您的需求自定义新的开箱即用仪表板。
如果您遇到困难,请查看此引导教程,了解如何导入数据。
要了解更多关于 Kibana 以及创建仪表板和使用 Discover 的信息。
预防、预测和修复问题
设置警报
在左侧导航栏的可观测性下,接下来您需要选择警报和创建规则。这将允许您在发生各种事件时(例如,延迟异常、指标聚合超过阈值等)通过电子邮件、Jira、Slack 等方式收到通知。
利用机器学习发现见解
在开始本节之前,请确保将您的节点部署到机器学习。
最后,导航至菜单中分析下的机器学习。在机器学习概览页面的左侧菜单中,在异常检测下选择作业以创建机器学习作业。通过设置机器学习作业,例如,当发生特定百分比(例如,50%,80%等)的内存使用率时,您将知道何时使用率不正常,而不是发出警报。
下一步
感谢您花时间使用 Elastic Cloud 监控您的 Kubernetes 集群。如果您是 Elastic 的新手,请务必启动一个免费的 14 天试用版。
此外,当您开始使用 Elastic 时,请了解您在整个环境中部署时应作为用户管理的一些操作、安全和数据组件。
准备开始了吗?在 Elastic Cloud 上启动一个免费的 14 天试用版。