按资源类型查看基础设施指标
编辑按资源类型查看基础设施指标
编辑基础设施清单 页面提供了一个以指标为驱动的视图,将您正在监控的整个基础设施按资源分组。显示所有发出核心基础设施指标集的监控资源,以便您快速了解基础设施的整体运行状况。
要打开基础设施清单,请在主菜单中找到基础设施,或使用全局搜索字段。
要详细了解此页面上显示的指标,请参阅指标参考文档。
如果没有指标要显示,Kibana 会提示您添加指标集成。单击添加指标集成开始操作。如果您希望将来添加更多数据,请从基础设施应用程序中的任何页面单击添加数据。
需要入门帮助?请按照日志和指标入门中的步骤操作。
筛选清单视图
编辑要开始分析,请选择要在高级视图中显示的资源类型。从显示菜单中,选择以下选项之一
- 主机 — 默认值
- Kubernetes Pod
- Docker 容器 — 显示所有容器,而不仅仅是 Docker
- AWS — 包括 EC2 实例、S3 存储桶、RDS 数据库和 SQS 队列
当您将鼠标悬停在华夫饼图中的每个资源上时,会显示该资源的特定指标。
您可以按资源排序,按与其相关的特定字段对资源进行分组,并按名称或指标值排序。例如,您可以筛选视图以显示 Kubernetes Pod 的内存使用情况,按命名空间分组,并按内存使用情况值排序。
您还可以使用搜索栏使用Kibana 查询语言创建结构化查询。例如,输入host.hostname : "host1"
以仅查看host1
的信息。
要检查特定时间段的指标,请使用时间筛选器选择日期和时间。
查看主机指标
编辑基础设施清单页面默认显示一个华夫饼图,其中显示了您正在监控的主机以及每个主机的当前 CPU 使用率。或者,您可以单击表格视图图标切换到表格视图。
无需离开基础设施清单页面,即可查看与基础设施中运行的每个主机相关的增强指标。在华夫饼图上,选择一个主机以显示主机详细信息叠加层。
要展开叠加层并查看更多详细信息,请单击右上角的作为页面打开。
主机详细信息叠加层包含以下选项卡
概述
概述选项卡显示有关所选主机的关键指标,例如 CPU 使用率、标准化负载、内存使用率和最大磁盘使用率。
更改时间范围以查看特定时间段内的指标。
展开每个部分以查看与所选主机相关的更多详细信息,例如元数据、活动警报、主机上检测到的服务和指标。
将鼠标悬停在图表上的特定时间段上,以比较该时间点的各种指标。
单击显示全部以深入了解相关数据。
元数据
元数据选项卡列出了与主机相关的所有元信息
- 主机信息
- 云信息
- 代理信息
所有这些信息在调查事件时都很有帮助,例如,按操作系统或架构筛选。
指标
指标选项卡按类型显示主机指标,并且比概述选项卡中提供的视图更完整。
进程
进程选项卡列出了主机上运行的进程总数(system.process.summary.total
),以及这些不同状态下的进程总数
- 运行中(
system.process.summary.running
) - 睡眠(
system.process.summary.sleeping
) - 已停止(
system.process.summary.stopped
) - 空闲(
system.process.summary.idle
) - 已死亡(
system.process.summary.dead
) - 僵死(
system.process.summary.zombie
) - 未知(
system.process.summary.unknown
)
顶级进程表中列出的进程基于对 CPU 占用率最高的进程和内存占用率最高的进程的聚合。顶级进程的数量由process.include_top_n.by_cpu
和process.include_top_n.by_memory
控制。
命令 |
启动进程的完整命令行,包括可执行文件的绝对路径和所有参数( |
PID |
进程 ID( |
用户 |
用户名( |
CPU |
自上次事件以来进程花费的 CPU 时间百分比( |
时间 |
进程启动时间( |
内存 |
进程在主内存(RAM)中占用的内存百分比( |
状态 |
进程的当前状态和进程总数( |
通用性能分析
通用性能分析选项卡显示了直至应用程序代码级别的 CPU 使用情况。在这里,您可以找到资源使用情况的来源,并识别可以优化以降低基础设施成本的代码。通用性能分析选项卡具有以下视图。
火焰图 |
消耗最多资源的函数的可视化表示。每个矩形代表一个函数。矩形的宽度表示在函数中花费的时间。堆叠矩形的数量表示堆栈深度,或到达当前函数所调用的函数数量。 |
前 10 个函数 |
主机上成本最高的代码行的列表。查看最常采样的函数,按 CPU 时间、年度化 CO2 和年度化成本估算进行细分。 |
有关通用性能分析的更多信息,请参阅通用性能分析文档。
日志
日志选项卡显示与您选择的主机相关的日志。默认情况下,日志选项卡显示以下列。
时间戳 |
来自 |
消息 |
从文档中提取的消息。此字段的内容取决于日志消息的类型。如果未检测到任何特殊的日志消息类型,则使用Elastic 通用架构 (ECS)基本字段 |
您可以通过为要筛选的任意字段添加列来自定义日志视图。有关更多信息,请参阅自定义流。要查看日志应用程序中的日志以进行详细分析,请单击在日志中打开。
异常
异常选项卡显示特定主机的每个单个指标异常检测作业的列表。默认情况下,异常作业按时间排序,首先显示最新的作业。
除了每个异常作业的名称外,还列出了检测到的严重性评分等于或高于 50 的异常。这些分数表示在选定时间段内“警告”或更高的严重性。摘要值表示异常记录结果中主机指标的实际值与预期(“典型”)值之间的增量。
要深入分析指标异常,请选择操作→在异常资源管理器中打开以查看机器学习中的异常资源管理器。您还可以选择操作→在清单中显示以查看主机清单页面,并按特定指标进行筛选。
Osquery
您必须拥有一个活动的Elastic Agent,并分配一个包含Osquery Manager集成的代理策略,并且作为用户拥有 Osquery Kibana 权限。
Osquery选项卡允许您构建 SQL 语句以查询主机数据。您可以针对 Elastic Agent 创建和运行实时或保存的查询。Osquery 结果存储在 Elasticsearch 中,以便您可以使用 Elastic Stack 搜索、分析和可视化主机指标。要创建保存的查询和添加计划的查询组,请参阅Osquery。
要查看有关查询的更多信息,请单击状态选项卡。查询状态可能导致success
、error
(以及错误消息)或pending
(如果 Elastic Agent 处于脱机状态)。
其他选项包括
在主机页面上查看主机时,也可以使用这些指标。
查看容器指标
编辑当您选择Docker 容器时,基础设施清单页面会显示一个华夫饼图,其中显示了您正在监控的容器以及每个容器当前的 CPU 使用率。或者,您可以点击表格视图图标切换到表格视图。
无需离开基础设施清单页面,即可查看与基础设施中运行的每个容器相关的增强指标。
在华夫饼图上,选择一个容器以显示容器详细信息叠加层。
要展开叠加层并查看更多详细信息,请单击右上角的作为页面打开。
容器详细信息叠加层包含以下选项卡
概述
概述选项卡显示有关所选容器的关键指标,例如 CPU、内存、网络和磁盘使用情况。显示的指标可能因您正在监控的容器类型而异。
更改时间范围以查看特定时间段内的指标。
展开每个部分以查看与所选容器相关的更多详细信息,例如元数据、活动警报和指标。
将鼠标悬停在图表上的特定时间段上,以比较该时间点的各种指标。
单击显示全部以深入了解相关数据。
元数据
元数据选项卡列出了与容器相关的所有元信息
- 主机信息
- 云信息
- 代理信息
所有这些信息在调查事件时都很有帮助,例如,按操作系统或架构筛选。
指标
指标选项卡按类型显示容器指标。
日志
日志选项卡显示与您选择的容器相关的日志。默认情况下,日志选项卡显示以下列。
时间戳 |
来自 |
消息 |
从文档中提取的消息。此字段的内容取决于日志消息的类型。如果未检测到任何特殊的日志消息类型,则使用Elastic 通用架构 (ECS)基本字段 |
您可以通过为要筛选的任意字段添加列来自定义日志视图。有关更多信息,请参阅自定义流。要查看日志应用程序中的日志以进行详细分析,请单击在日志中打开。
查看其他资源的指标
编辑当您搜索并筛选特定资源时,您可以深入分析与其相关的指标。例如,在高级视图中查看 Kubernetes Pod 时,点击您要分析的 Pod 并选择Kubernetes Pod 指标以查看详细指标
添加自定义指标
编辑如果每个资源的清单页面上显示的预定义指标不足以满足您的特定用例,您可以添加和定义自定义指标。
选择您的资源,然后从指标筛选器菜单中点击添加指标。
与日志、正常运行时间和 APM 集成
编辑根据您已安装和配置的功能,您可以查看与特定资源相关的日志、跟踪或正常运行时间信息。例如,在高级视图中,当您点击 Kubernetes Pod 资源时,您可以选择
- Kubernetes Pod 日志以在日志应用程序中查看相应的日志。
- Kubernetes Pod APM 跟踪以在应用程序 UI 中查看相应的 APM 跟踪。
- Kubernetes Pod 在正常运行时间以在正常运行时间应用程序中查看相关正常运行时间信息。