按资源类型查看基础设施指标
编辑按资源类型查看基础设施指标编辑
清单 页面提供您正在监控的所有资源的指标驱动视图,这些资源按您正在监控的资源分组。所有发出核心基础设施指标集的监控资源都会显示,以便您可以快速了解基础设施的整体运行状况。
要从 Kibana 主菜单访问此页面,请转到 可观测性 → 基础设施 → 清单。
要详细了解此页面上显示的指标,请参阅 指标参考 文档。
如果没有指标要显示,Kibana 会提示您添加指标集成。单击 添加指标集成 开始。如果您想在将来添加更多数据,请从基础设施应用程序中的任何页面单击 添加数据。
需要帮助入门?请按照 日志和指标入门 中的步骤操作。
筛选清单视图编辑
要开始分析,请选择要在高级视图中显示的资源类型。从 显示 菜单中,选择以下选项之一
- 主机(默认值)
- Kubernetes Pod
- Docker 容器
- AWS,包括 EC2 实例、S3 存储桶、RDS 数据库和 SQS 队列
当您将鼠标悬停在蜂窝地图中的每个资源上时,会显示特定于该资源的指标。
您可以按资源排序,按与其相关的特定字段对资源进行分组,并按名称或指标值排序。例如,您可以筛选视图以显示 Kubernetes Pod 的内存使用情况,按命名空间分组,并按内存使用情况值排序。
您还可以使用搜索栏使用 Kibana 查询语言 创建结构化查询。例如,输入 host.hostname : "host1"
仅查看 host1
的信息。
要检查特定时间的指标,请使用时间筛选器选择日期和时间。
查看主机指标编辑
默认情况下,清单 页面显示一个蜂窝地图,其中显示您正在监控的主机以及每个主机的当前 CPU 使用率。或者,您可以单击 表格视图 图标 切换到表格视图。
无需离开 清单 页面,您就可以查看与基础设施中运行的每个主机相关的增强指标。在蜂窝地图上,选择一个主机以显示主机详细信息叠加层。
要展开叠加层并查看更多详细信息,请单击右上角的 以页面形式打开。
主机详细信息叠加层包含以下选项卡
概述
概述 选项卡显示有关所选主机的关键指标,例如 CPU 使用率、归一化负载、内存使用率和最大磁盘使用率。
更改时间范围以查看特定时间段内的指标。
展开每个部分以查看与所选主机相关的更多详细信息,例如元数据、活动警报、主机上检测到的服务和指标。
将鼠标悬停在图表上的特定时间段上,以比较该时间点的各种指标。
单击 显示全部 深入了解相关数据。
元数据
元数据 选项卡列出与主机相关的全部元信息
- 主机信息
- 云信息
- 代理信息
所有这些信息都有助于调查事件,例如,按操作系统或体系结构筛选。
指标
指标 选项卡按类型显示主机指标,比 概述 选项卡中提供的视图更完整。
进程
进程 选项卡列出主机上运行的进程总数 (system.process.summary.total
),以及以下各种状态的进程总数
- 运行 (
system.process.summary.running
) - 休眠 (
system.process.summary.sleeping
) - 停止 (
system.process.summary.stopped
) - 空闲 (
system.process.summary.idle
) - 死亡 (
system.process.summary.dead
) - 僵尸 (
system.process.summary.zombie
) - 未知 (
system.process.summary.unknown
)
顶级进程 表中列出的进程基于对顶级 CPU 和顶级内存消耗进程的聚合。顶级进程的数量由 process.include_top_n.by_cpu
和 process.include_top_n.by_memory
控制。
命令 |
启动进程的完整命令行,包括可执行文件的绝对路径和所有参数 ( |
PID |
进程 ID ( |
用户 |
用户名 ( |
CPU |
进程自上次事件以来所占用的 CPU 时间百分比 ( |
时间 |
进程启动的时间 ( |
内存 |
进程在主内存 (RAM) 中占用的内存百分比 ( |
状态 |
进程的当前状态和进程总数 ( |
通用性能分析
通用性能分析 选项卡显示 CPU 使用率,直至应用程序代码级别。从这里,您可以找到资源使用率的来源,并识别可以优化以降低基础设施成本的代码。通用性能分析选项卡具有以下视图。
火焰图 |
消耗最多资源的函数的直观表示。每个矩形代表一个函数。矩形的宽度表示在函数中花费的时间。堆叠矩形的数量表示堆栈深度,或到达当前函数所调用的函数数量。 |
前 10 个函数 |
主机上最昂贵的代码行的列表。查看最常采样的函数,按 CPU 时间、年化 CO2 和年化成本估算进行细分。 |
有关通用性能分析的更多信息,请参阅 通用性能分析 文档。
日志
日志 选项卡显示与您选择的主机相关的日志。默认情况下,日志选项卡显示以下列。
时间戳 |
来自 |
消息 |
从文档中提取的消息。此字段的内容取决于日志消息的类型。如果未检测到任何特殊的日志消息类型,则使用 Elastic 通用模式 (ECS) 基本字段 |
您可以通过添加您想要筛选的任意字段的列来自定义日志视图。有关更多信息,请参阅 自定义流。要在日志应用程序中查看日志以进行详细分析,请单击 在日志中打开。
异常
异常 选项卡显示特定主机的每个单指标异常检测作业的列表。默认情况下,异常作业按时间排序,最近的作业排在最前面。
除了每个异常作业的名称外,还列出了检测到的严重程度评分等于或高于 50 的异常。这些评分代表所选时间段内“警告”或更高严重程度。摘要 值表示异常记录结果中主机指标的实际值与预期值(“典型”值)之间的增量。
要深入分析指标异常,请选择 操作 → 在异常资源管理器中打开 以查看 机器学习中的异常资源管理器。您也可以选择 操作 → 在清单中显示 以查看主机清单页面,并按特定指标进行筛选。
Osquery
您必须拥有一个活动的 Elastic Agent,并分配一个包含 Osquery Manager 集成的代理策略,并且必须具有 Osquery Kibana 权限 作为用户。
Osquery 选项卡允许您构建 SQL 语句以查询主机数据。您可以针对 Elastic Agent 创建和运行实时或保存的查询。Osquery 结果存储在 Elasticsearch 中,以便您可以使用 Elastic Stack 搜索、分析和可视化主机指标。要创建保存的查询并添加计划的查询组,请参阅 Osquery。
要查看有关查询的更多信息,请单击 状态 选项卡。查询状态可能导致 success
、error
(以及错误消息)或 pending
(如果 Elastic Agent 处于脱机状态)。
其他选项包括
这些指标在 主机 页面上查看主机时也可以使用。
查看其他资源的指标编辑
在搜索和筛选特定资源后,您可以深入分析与之相关的指标。例如,在查看高级视图中的 Kubernetes Pod 时,单击要分析的 Pod 并选择Kubernetes Pod 指标以查看详细指标。
添加自定义指标编辑
如果每个资源的库存页面上显示的预定义指标不足以满足您的特定用例,您可以添加和定义自定义指标。
选择您的资源,然后从指标筛选器菜单中单击添加指标。
与日志、正常运行时间和 APM 集成编辑
根据您已安装和配置的功能,您可以查看与特定资源相关的日志、跟踪或正常运行时间信息。例如,在高级视图中,当您单击 Kubernetes Pod 资源时,您可以选择
- Kubernetes Pod 日志以查看相应的日志在日志应用程序中。
- Kubernetes Pod APM 跟踪以查看相应的 APM 跟踪在 APM 应用程序中。
- Kubernetes Pod 在正常运行时间中以查看相关的正常运行时间信息在正常运行时间应用程序中。