按资源类型查看基础设施指标

编辑

基础设施清单 页面提供了一个以指标为驱动的视图,将您正在监控的整个基础设施按资源分组。显示所有发出核心基础设施指标集的监控资源,以便您快速了解基础设施的整体运行状况。

要打开基础设施清单,请在主菜单中找到基础设施,或使用全局搜索字段

Infrastructure inventory

要详细了解此页面上显示的指标,请参阅指标参考文档。

如果没有指标要显示,Kibana 会提示您添加指标集成。单击添加指标集成开始操作。如果您希望将来添加更多数据,请从基础设施应用程序中的任何页面单击添加数据

需要入门帮助?请按照日志和指标入门中的步骤操作。

筛选清单视图
编辑

要开始分析,请选择要在高级视图中显示的资源类型。从显示菜单中,选择以下选项之一

  • 主机 — 默认值
  • Kubernetes Pod
  • Docker 容器 — 显示所有容器,而不仅仅是 Docker
  • AWS — 包括 EC2 实例、S3 存储桶、RDS 数据库和 SQS 队列

当您将鼠标悬停在华夫饼图中的每个资源上时,会显示该资源的特定指标。

您可以按资源排序,按与其相关的特定字段对资源进行分组,并按名称或指标值排序。例如,您可以筛选视图以显示 Kubernetes Pod 的内存使用情况,按命名空间分组,并按内存使用情况值排序。

Kubernetes pod filtering

您还可以使用搜索栏使用Kibana 查询语言创建结构化查询。例如,输入host.hostname : "host1" 以仅查看host1的信息。

要检查特定时间段的指标,请使用时间筛选器选择日期和时间。

查看主机指标
编辑

基础设施清单页面默认显示一个华夫饼图,其中显示了您正在监控的主机以及每个主机的当前 CPU 使用率。或者,您可以单击表格视图图标表格视图图标切换到表格视图。

无需离开基础设施清单页面,即可查看与基础设施中运行的每个主机相关的增强指标。在华夫饼图上,选择一个主机以显示主机详细信息叠加层。

要展开叠加层并查看更多详细信息,请单击右上角的作为页面打开

主机详细信息叠加层包含以下选项卡

概述

概述选项卡显示有关所选主机的关键指标,例如 CPU 使用率、标准化负载、内存使用率和最大磁盘使用率。

更改时间范围以查看特定时间段内的指标。

展开每个部分以查看与所选主机相关的更多详细信息,例如元数据、活动警报、主机上检测到的服务和指标。

将鼠标悬停在图表上的特定时间段上,以比较该时间点的各种指标。

单击显示全部以深入了解相关数据。

Host overview
元数据

元数据选项卡列出了与主机相关的所有元信息

  • 主机信息
  • 云信息
  • 代理信息

所有这些信息在调查事件时都很有帮助,例如,按操作系统或架构筛选。

Host metadata
指标

指标选项卡按类型显示主机指标,并且比概述选项卡中提供的视图更完整。

Metrics
进程

进程选项卡列出了主机上运行的进程总数(system.process.summary.total),以及这些不同状态下的进程总数

  • 运行中(system.process.summary.running
  • 睡眠(system.process.summary.sleeping
  • 已停止(system.process.summary.stopped
  • 空闲(system.process.summary.idle
  • 已死亡(system.process.summary.dead
  • 僵死(system.process.summary.zombie
  • 未知(system.process.summary.unknown

顶级进程表中列出的进程基于对 CPU 占用率最高的进程和内存占用率最高的进程的聚合。顶级进程的数量由process.include_top_n.by_cpuprocess.include_top_n.by_memory控制。

命令

启动进程的完整命令行,包括可执行文件的绝对路径和所有参数(system.process.cmdline)。

PID

进程 ID(process.pid)。

用户

用户名(user.name)。

CPU

自上次事件以来进程花费的 CPU 时间百分比(system.process.cpu.total.pct)。

时间

进程启动时间(system.process.cpu.start_time)。

内存

进程在主内存(RAM)中占用的内存百分比(system.process.memory.rss.pct)。

状态

进程的当前状态和进程总数(system.process.state)。预期值为:runningsleepingdeadstoppedidlezombieunknown

Host processes
通用性能分析

通用性能分析选项卡显示了直至应用程序代码级别的 CPU 使用情况。在这里,您可以找到资源使用情况的来源,并识别可以优化以降低基础设施成本的代码。通用性能分析选项卡具有以下视图。

火焰图

消耗最多资源的函数的可视化表示。每个矩形代表一个函数。矩形的宽度表示在函数中花费的时间。堆叠矩形的数量表示堆栈深度,或到达当前函数所调用的函数数量。

前 10 个函数

主机上成本最高的代码行的列表。查看最常采样的函数,按 CPU 时间、年度化 CO2 和年度化成本估算进行细分。

有关通用性能分析的更多信息,请参阅通用性能分析文档。

Host Universal Profiling
日志

日志选项卡显示与您选择的主机相关的日志。默认情况下,日志选项卡显示以下列。

时间戳

来自timestamp字段的日志条目的时间戳。

消息

从文档中提取的消息。此字段的内容取决于日志消息的类型。如果未检测到任何特殊的日志消息类型,则使用Elastic 通用架构 (ECS)基本字段message

您可以通过为要筛选的任意字段添加列来自定义日志视图。有关更多信息,请参阅自定义流。要查看日志应用程序中的日志以进行详细分析,请单击在日志中打开

Host logs
异常

异常选项卡显示特定主机的每个单个指标异常检测作业的列表。默认情况下,异常作业按时间排序,首先显示最新的作业。

除了每个异常作业的名称外,还列出了检测到的严重性评分等于或高于 50 的异常。这些分数表示在选定时间段内“警告”或更高的严重性。摘要值表示异常记录结果中主机指标的实际值与预期(“典型”)值之间的增量。

要深入分析指标异常,请选择操作→在异常资源管理器中打开以查看机器学习中的异常资源管理器。您还可以选择操作→在清单中显示以查看主机清单页面,并按特定指标进行筛选。

Anomalies
Osquery

您必须拥有一个活动的Elastic Agent,并分配一个包含Osquery Manager集成的代理策略,并且作为用户拥有 Osquery Kibana 权限

Osquery选项卡允许您构建 SQL 语句以查询主机数据。您可以针对 Elastic Agent 创建和运行实时或保存的查询。Osquery 结果存储在 Elasticsearch 中,以便您可以使用 Elastic Stack 搜索、分析和可视化主机指标。要创建保存的查询和添加计划的查询组,请参阅Osquery

要查看有关查询的更多信息,请单击状态选项卡。查询状态可能导致successerror(以及错误消息)或pending(如果 Elastic Agent 处于脱机状态)。

其他选项包括

  • 在“发现”中查看以搜索、筛选和查看有关主机指标字段结构的信息。要了解详细信息,请参阅发现

  • 在 Lens 中查看,基于您的主机指标字段创建可视化。要了解更多信息,请参阅Lens
  • 以全屏模式查看结果。
  • 添加、删除、重新排序和调整列的大小。
  • 按升序或降序排列字段名称。
Osquery

主机页面上查看主机时,也可以使用这些指标。

查看容器指标
编辑

当您选择Docker 容器时,基础设施清单页面会显示一个华夫饼图,其中显示了您正在监控的容器以及每个容器当前的 CPU 使用率。或者,您可以点击表格视图图标表格视图图标切换到表格视图。

无需离开基础设施清单页面,即可查看与基础设施中运行的每个容器相关的增强指标。

在华夫饼图上,选择一个容器以显示容器详细信息叠加层。

要展开叠加层并查看更多详细信息,请单击右上角的作为页面打开

容器详细信息叠加层包含以下选项卡

概述

概述选项卡显示有关所选容器的关键指标,例如 CPU、内存、网络和磁盘使用情况。显示的指标可能因您正在监控的容器类型而异。

更改时间范围以查看特定时间段内的指标。

展开每个部分以查看与所选容器相关的更多详细信息,例如元数据、活动警报和指标。

将鼠标悬停在图表上的特定时间段上,以比较该时间点的各种指标。

单击显示全部以深入了解相关数据。

Container overview
元数据

元数据选项卡列出了与容器相关的所有元信息

  • 主机信息
  • 云信息
  • 代理信息

所有这些信息在调查事件时都很有帮助,例如,按操作系统或架构筛选。

Container metadata
指标

指标选项卡按类型显示容器指标。

Metrics
日志

日志选项卡显示与您选择的容器相关的日志。默认情况下,日志选项卡显示以下列。

时间戳

来自timestamp字段的日志条目的时间戳。

消息

从文档中提取的消息。此字段的内容取决于日志消息的类型。如果未检测到任何特殊的日志消息类型,则使用Elastic 通用架构 (ECS)基本字段message

您可以通过为要筛选的任意字段添加列来自定义日志视图。有关更多信息,请参阅自定义流。要查看日志应用程序中的日志以进行详细分析,请单击在日志中打开

Container logs
查看其他资源的指标
编辑

当您搜索并筛选特定资源时,您可以深入分析与其相关的指标。例如,在高级视图中查看 Kubernetes Pod 时,点击您要分析的 Pod 并选择Kubernetes Pod 指标以查看详细指标

Kubernetes pod metrics
添加自定义指标
编辑

如果每个资源的清单页面上显示的预定义指标不足以满足您的特定用例,您可以添加和定义自定义指标。

选择您的资源,然后从指标筛选器菜单中点击添加指标

Add custom metrics
与日志、正常运行时间和 APM 集成
编辑

根据您已安装和配置的功能,您可以查看与特定资源相关的日志、跟踪或正常运行时间信息。例如,在高级视图中,当您点击 Kubernetes Pod 资源时,您可以选择