按资源类型查看基础设施指标

编辑

基础设施清单页面提供了按您监控的资源分组的整个基础设施的指标驱动视图。所有发出核心基础设施指标的受监控资源都会显示,以便您快速了解基础设施的整体运行状况。

要打开基础设施清单,请在主菜单中找到基础设施,或使用全局搜索字段

Infrastructure inventory

要了解有关此页面上显示的指标的更多信息,请参阅指标参考文档。

如果没有要显示的指标,Kibana 会提示您添加指标集成。单击添加指标集成即可开始。如果您将来想添加更多数据,请从“基础设施”应用程序中的任何页面单击添加数据

需要帮助入门吗?请按照日志和指标入门中的步骤操作。

筛选清单视图
编辑

要开始分析,请选择要在高级视图中显示的资源类型。从显示菜单中,选择以下选项之一

  • 主机 — 默认
  • Kubernetes Pod
  • Docker 容器 — 显示所有容器,而不仅仅是 Docker
  • AWS — 包括 EC2 实例、S3 存储桶、RDS 数据库和 SQS 队列

当您将鼠标悬停在华夫饼图中的每个资源上时,将显示该资源特有的指标。

您可以按资源排序、按与其相关的特定字段对资源进行分组,以及按名称或指标值排序。例如,您可以筛选视图以显示 Kubernetes Pod 的内存使用情况,按命名空间分组,并按内存使用值排序。

Kubernetes pod filtering

您还可以使用搜索栏使用Kibana 查询语言创建结构化查询。例如,输入host.hostname : "host1"以仅查看host1的信息。

要检查特定时间的指标,请使用时间筛选器选择日期和时间。

查看主机指标
编辑

默认情况下,基础设施清单页面会显示一个华夫饼图,其中显示您正在监控的主机以及每个主机的当前 CPU 使用率。或者,您可以单击表格视图图标 表格视图图标 以切换到表格视图。

无需离开基础设施清单页面,即可查看与您的基础设施中运行的每个主机相关的增强指标。在华夫饼图上,选择一个主机以显示主机详细信息叠加层。

要展开叠加层并查看更多详细信息,请单击右上角的作为页面打开

主机详细信息叠加层包含以下选项卡

概览

概览选项卡显示有关所选主机的关键指标,例如 CPU 使用率、归一化负载、内存使用率和最大磁盘使用率。

更改时间范围以查看特定时间段内的指标。

展开每个部分以查看与所选主机相关的更多详细信息,例如元数据、活动警报、主机上检测到的服务和指标。

将鼠标悬停在图表上的特定时间段上,以比较该给定时间的各种指标。

单击显示全部以深入了解相关数据。

Host overview
元数据

元数据选项卡列出了与主机相关的所有元信息

  • 主机信息
  • 云信息
  • 代理信息

所有这些信息都可以在调查事件时提供帮助,例如按操作系统或架构进行筛选。

Host metadata
指标

指标选项卡显示按类型组织的主机指标,比概览选项卡中可用的视图更完整。

Metrics
进程

进程选项卡列出主机上运行的进程总数 (system.process.summary.total) 以及这些各种状态的进程总数

  • 正在运行 (system.process.summary.running)
  • 正在休眠 (system.process.summary.sleeping)
  • 已停止 (system.process.summary.stopped)
  • 空闲 (system.process.summary.idle)
  • 已终止 (system.process.summary.dead)
  • 僵尸 (system.process.summary.zombie)
  • 未知 (system.process.summary.unknown)

顶部进程表中列出的进程基于顶部 CPU 和顶部内存消耗进程的聚合。顶部进程的数量由process.include_top_n.by_cpuprocess.include_top_n.by_memory控制。

命令

启动进程的完整命令行,包括可执行文件的绝对路径和所有参数 (system.process.cmdline)。

PID

进程 ID (process.pid)。

用户

用户名 (user.name)。

CPU

自上次事件以来进程花费的 CPU 时间百分比 (system.process.cpu.total.pct)。

时间

进程启动的时间 (system.process.cpu.start_time)。

内存

进程在主内存 (RAM) 中占用的内存百分比 (system.process.memory.rss.pct)。

状态

进程的当前状态和进程总数 (system.process.state)。预期值为:runningsleepingdeadstoppedidlezombieunknown

Host processes
通用性能分析

通用性能分析选项卡显示 CPU 使用率降至应用程序代码级别。从这里,您可以找到资源使用的来源,并识别可以优化以降低基础设施成本的代码。“通用性能分析”选项卡具有以下视图。

火焰图

一种以图形方式表示消耗最多资源的函数。每个矩形表示一个函数。矩形宽度表示在函数中花费的时间。堆叠矩形的数量表示堆栈深度,或者调用以到达当前函数的函数数量。

前 10 个函数

主机上最昂贵的代码行列表。查看最常采样的函数,按 CPU 时间、年化 CO2 和年化成本估算进行细分。

有关通用性能分析的更多信息,请参阅通用性能分析文档。

Host Universal Profiling
日志

日志选项卡显示与您选择的主机相关的日志。默认情况下,“日志”选项卡会显示以下列。

时间戳

来自 timestamp 字段的日志条目的时间戳。

消息

从文档中提取的消息。此字段的内容取决于日志消息的类型。如果未检测到特殊的日志消息类型,则使用Elastic Common Schema (ECS)基本字段 message

您可以通过添加要筛选的任意字段的列来自定义日志视图。有关更多信息,请参阅自定义流。要在“日志”应用程序中查看日志以进行详细分析,请单击在“日志”中打开

Host logs
异常

异常选项卡显示特定主机的每个单一指标异常检测作业的列表。默认情况下,异常作业按时间排序,首先显示最近的作业。

除了每个异常作业的名称外,还会列出严重性评分等于或高于 50 的检测到的异常。这些评分表示在所选时间段内严重性为“警告”或更高。摘要值表示在异常记录结果中主机指标的实际值和预期(“典型”)值之间的增量。

要深入分析指标异常,请选择操作 → 在异常浏览器中打开以查看机器学习中的异常浏览器。您还可以选择操作 → 在清单中显示以查看按特定指标筛选的主机清单页面。

Anomalies
Osquery

您必须拥有活动的Elastic Agent,该代理具有包含Osquery Manager集成的已分配代理策略,并且作为用户具有 Osquery Kibana 权限

Osquery选项卡允许您构建 SQL 语句来查询主机数据。您可以创建和运行针对 Elastic Agent 的实时或已保存查询。Osquery 结果存储在 Elasticsearch 中,以便您可以使用 Elastic Stack 来搜索、分析和可视化主机指标。要创建已保存的查询并添加计划的查询组,请参阅Osquery

要查看有关查询的更多信息,请单击状态选项卡。查询状态可能会导致 successerror(以及错误消息)或 pending(如果 Elastic Agent 处于脱机状态)。

其他选项包括

  • 在“发现”中查看以搜索、筛选和查看有关主机指标字段结构的信息。要了解更多信息,请参阅发现
  • 在 Lens 中查看,以基于您的主机指标字段创建可视化效果。要了解更多信息,请参阅 Lens
  • 以全屏模式查看结果。
  • 添加、删除、重新排序和调整列的大小。
  • 按升序或降序对字段名称进行排序。
Osquery

这些指标在查看主机页面上的主机时也可用。

查看容器指标
编辑

当您选择Docker 容器时,基础设施清单页面会显示一个华夫饼图,其中显示您正在监控的容器以及每个容器当前的 CPU 使用率。或者,您可以单击表格视图图标 表格视图图标切换到表格视图。

无需离开基础设施清单页面,您就可以查看与基础设施中运行的每个容器相关的增强指标。

在华夫饼图上,选择一个容器以显示容器详细信息覆盖层。

要展开叠加层并查看更多详细信息,请单击右上角的作为页面打开

容器详细信息覆盖层包含以下选项卡

概览

概述选项卡显示有关所选容器的关键指标,例如 CPU、内存、网络和磁盘使用情况。显示的指标可能会因您正在监控的容器类型而异。

更改时间范围以查看特定时间段内的指标。

展开每个部分以查看与所选容器相关的更多详细信息,例如元数据、活动警报和指标。

将鼠标悬停在图表上的特定时间段上,以比较该给定时间的各种指标。

单击显示全部以深入了解相关数据。

Container overview
元数据

元数据选项卡列出与容器相关的所有元信息

  • 主机信息
  • 云信息
  • 代理信息

所有这些信息都可以在调查事件时提供帮助,例如按操作系统或架构进行筛选。

Container metadata
指标

指标选项卡显示按类型组织的容器指标。

Metrics
日志

日志选项卡显示与您选择的容器相关的日志。默认情况下,“日志”选项卡显示以下列。

时间戳

来自 timestamp 字段的日志条目的时间戳。

消息

从文档中提取的消息。此字段的内容取决于日志消息的类型。如果未检测到特殊的日志消息类型,则使用Elastic Common Schema (ECS)基本字段 message

您可以通过添加要筛选的任意字段的列来自定义日志视图。有关更多信息,请参阅自定义流。要在“日志”应用程序中查看日志以进行详细分析,请单击在“日志”中打开

Container logs
查看其他资源的指标
编辑

当您搜索并筛选特定资源时,可以深入分析与其相关的指标。例如,在高层视图中查看 Kubernetes Pod 时,单击要分析的 Pod 并选择Kubernetes Pod 指标以查看详细指标

Kubernetes pod metrics
添加自定义指标
编辑

如果“清单”页面上为每个资源显示的预定义指标不足以满足您的特定用例,您可以添加和定义自定义指标。

选择您的资源,然后从指标筛选菜单中,单击添加指标

Add custom metrics
与日志、Uptime 和 APM 集成
编辑

根据您已安装和配置的功能,您可以查看与特定资源相关的日志、跟踪或正常运行时间信息。例如,在高层视图中,当您单击 Kubernetes Pod 资源时,您可以选择