主机指标

编辑

了解基础设施应用程序中显示的关键主机指标

主机指标
编辑
指标 描述

主机

搜索条件返回的主机数量。

字段计算: count(system.cpu.cores)

CPU 使用率指标
编辑
指标 描述

CPU 使用率 (%)

CPU 时间在除空闲和 IOWait 之外的状态下所占百分比的平均值,按 CPU 核心数进行归一化。包括用户空间和内核空间所花费的时间。100% 表示主机的所有 CPU 都处于繁忙状态。

字段计算: average(system.cpu.total.norm.pct)

有关旧版指标计算,请参阅旧版指标

CPU 使用率 - iowait (%)

CPU 时间在等待(磁盘)状态下所占的百分比。

字段计算: average(system.cpu.iowait.pct) / max(system.cpu.cores)

CPU 使用率 - irq (%)

CPU 时间用于处理硬件中断的百分比。

字段计算: average(system.cpu.irq.pct) / max(system.cpu.cores)

CPU 使用率 - nice (%)

CPU 时间用于低优先级进程的百分比。

字段计算: average(system.cpu.nice.pct) / max(system.cpu.cores)

CPU 使用率 - softirq (%)

CPU 时间用于处理软件中断的百分比。

字段计算: average(system.cpu.softirq.pct) / max(system.cpu.cores)

CPU 使用率 - steal (%)

虚拟 CPU 在虚拟机管理程序处理另一个处理器时处于非自愿等待状态的 CPU 时间百分比。仅在 Unix 系统上可用。

字段计算: average(system.cpu.steal.pct) / max(system.cpu.cores)

CPU 使用率 - system (%)

CPU 时间在内核空间中所占的百分比。

字段计算: average(system.cpu.system.pct) / max(system.cpu.cores)

CPU 使用率 - user (%)

CPU 时间在用户空间中所占的百分比。在多核系统上,百分比可以大于 100%。例如,如果 3 个核心使用率为 60%,则 system.cpu.user.pct 将为 180%。

字段计算: average(system.cpu.user.pct) / max(system.cpu.cores)

负载 (1m)

1 分钟平均负载。

平均负载表示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞式 IO 操作完成)。

字段计算: average(system.load.1)

负载 (5m)

5 分钟平均负载。

平均负载表示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞式 IO 操作完成)。

字段计算: average(system.load.5)

负载 (15m)

15 分钟平均负载。

平均负载表示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞式 IO 操作完成)。

字段计算: average(system.load.15)

归一化负载

按 CPU 核心数归一化的 1 分钟平均负载。

平均负载表示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞式 IO 操作完成)。

100% 表示 1 分钟平均负载等于主机 CPU 核心数。

以 32 个 CPU 核心主机为例,如果 1 分钟平均负载为 32,则此处报告的值为 100%。如果 1 分钟平均负载为 48,则此处报告的值为 150%。

字段计算: average(system.load.1) / max(system.load.cores)

内存指标
编辑
指标 描述

内存缓存

内存(页)缓存。

字段计算: average(system.memory.used.bytes ) - average(system.memory.actual.used.bytes)

可用内存

总可用内存。

字段计算: max(system.memory.total) - average(system.memory.actual.used.bytes)

可用内存(不包括缓存)

不包括页缓存的总可用内存。

字段计算: system.memory.free

总内存

总内存容量。

字段计算: avg(system.memory.total)

内存使用率 (%)

不包括页缓存的主内存使用率百分比。

这包括所有进程的驻留内存,以及除页缓存外的内核结构和代码使用的内存。

高水平表示主机内存饱和的情况。例如,100% 表示主内存完全被无法回收的内存填满,除非通过交换出去。

字段计算: average(system.memory.actual.used.pct)

已用内存

不包括页缓存的主内存使用率。

字段计算: average(system.memory.actual.used.bytes)

日志指标
编辑
指标 描述

日志速率

文档计数累积和的导数,按 1 秒速率缩放。此指标依赖于与日志相同的索引。

字段计算: cumulative_sum(doc_count)

网络指标
编辑
指标 描述

网络入站 (RX)

主机公共接口每秒接收的字节数。

字段计算: sum(host.network.ingress.bytes) * 8 / 1000

有关旧版指标计算,请参阅旧版指标

网络出站 (TX)

主机公共接口每秒发送的字节数。

字段计算: sum(host.network.egress.bytes) * 8 / 1000

有关旧版指标计算,请参阅旧版指标

磁盘指标
编辑
指标 描述

磁盘延迟

处理磁盘请求所花费的时间。

字段计算: average(system.diskio.read.time + system.diskio.write.time) / (system.diskio.read.count + system.diskio.write.count)

磁盘读取 IOPS

每秒从设备读取操作的平均计数。

字段计算: counter_rate(max(system.diskio.read.count), kql='system.diskio.read.count: *')

磁盘读取吞吐量

每秒从设备读取的平均字节数。

字段计算: counter_rate(max(system.diskio.read.bytes), kql='system.diskio.read.bytes: *')

磁盘使用率 - 可用 (%)

可用的磁盘空间百分比。

字段计算: 1-average(system.filesystem.used.pct)

磁盘使用率 - 最大 (%)

已使用磁盘空间的百分比。高百分比表示磁盘上的分区空间不足。

字段计算: max(system.filesystem.used.pct)

磁盘写入 IOPS

每秒从设备写入操作的平均计数。

字段计算: counter_rate(max(system.diskio.write.count), kql='system.diskio.write.count: *')

磁盘写入吞吐量

每秒写入设备的平均字节数。

字段计算: counter_rate(max(system.diskio.write.bytes), kql='system.diskio.write.bytes: *')

旧版指标
编辑

随着时间的推移,我们可能会更改用于计算特定指标的公式。为了避免影响您现有的规则,我们创建了一个新的指标,并将旧指标称为“旧版”,而不是更改实际的指标定义。

UI 和您创建的任何新规则都将使用新的指标定义。但是,任何使用旧定义的警报都将该指标称为“旧版”。

指标 描述

CPU 使用率(旧版)

CPU 时间在除空闲和 IOWait 之外的状态下所占百分比,按 CPU 核心数进行归一化。这包括用户空间和内核空间所花费的时间。100% 表示主机的所有 CPU 都处于繁忙状态。

字段计算: (average(system.cpu.user.pct) + average(system.cpu.system.pct)) / max(system.cpu.cores)

网络入站 (RX)(旧版)

主机公共接口每秒接收的字节数。

字段计算: average(host.network.ingress.bytes) * 8 / (max(metricset.period, kql='host.network.ingress.bytes: *') / 1000)

网络出站 (TX)(旧版)

主机公共接口每秒发送的字节数。

字段计算: average(host.network.egress.bytes) * 8 / (max(metricset.period, kql='host.network.egress.bytes: *') / 1000)