主机指标编辑

了解基础架构应用中显示的关键主机指标

主机指标编辑
指标 描述

主机

搜索条件返回的主机数量。

字段计算: count(system.cpu.cores)

CPU 使用率指标编辑
指标 描述

CPU 使用率 (%)

CPU 时间花费在空闲和 IOWait 以外状态的百分比,按 CPU 核心数标准化。这包括用户空间和内核空间花费的时间。

100% 表示主机的所有 CPU 都处于繁忙状态。

字段计算: (average(system.cpu.user.pct) + average(system.cpu.system.pct)) / max(system.cpu.cores)

CPU 使用率 - iowait (%)

CPU 时间花费在等待(磁盘)上的百分比。

字段计算: average(system.cpu.iowait.pct) / max(system.cpu.cores)

CPU 使用率 - irq (%)

CPU 时间花费在服务和处理硬件中断上的百分比。

字段计算: average(system.cpu.irq.pct) / max(system.cpu.cores)

CPU 使用率 - nice (%)

CPU 时间花费在低优先级进程上的百分比。

字段计算: average(system.cpu.nice.pct) / max(system.cpu.cores)

CPU 使用率 - softirq (%)

CPU 时间花费在服务和处理软件中断上的百分比。

字段计算: average(system.cpu.softirq.pct) / max(system.cpu.cores)

CPU 使用率 - steal (%)

当虚拟机管理程序为另一个处理器提供服务时,虚拟 CPU 非自愿等待所花费的 CPU 时间百分比。仅在 Unix 上可用。

字段计算: average(system.cpu.steal.pct) / max(system.cpu.cores)

CPU 使用率 - system (%)

CPU 时间花费在内核空间的百分比。

字段计算: average(system.cpu.system.pct) / max(system.cpu.cores)

CPU 使用率 - user (%)

CPU 时间花费在用户空间的百分比。在多核系统上,您可能会看到大于 100% 的百分比。例如,如果 3 个核心使用率为 60%,则 system.cpu.user.pct 将为 180%。

字段计算: average(system.cpu.user.pct) / max(system.cpu.cores)

负载 (1 分钟)

1 分钟负载平均值。

负载平均值指示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞 IO 操作完成)。

字段计算: average(system.load.1)

负载 (5 分钟)

5 分钟负载平均值。

负载平均值指示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞 IO 操作完成)。

字段计算: average(system.load.5)

负载 (15 分钟)

15 分钟负载平均值。

负载平均值指示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞 IO 操作完成)。

字段计算: average(system.load.15)

标准化负载

按 CPU 核心数标准化的 1 分钟负载平均值。

负载平均值指示可运行线程的数量(正在 CPU 上运行、等待运行或等待阻塞 IO 操作完成)。

100% 表示 1 分钟负载平均值等于主机的 CPU 核心数。

以 32 个 CPU 核心的主机为例,如果 1 分钟负载平均值为 32,则此处报告的值为 100%。如果 1 分钟负载平均值为 48,则此处报告的值为 150%。

字段计算: average(system.load.1) / max(system.load.cores)

内存指标编辑
指标 描述

内存缓存

内存(页面)缓存。

字段计算: average(system.memory.used.bytes ) - average(system.memory.actual.used.bytes)

空闲内存

总可用内存。

字段计算: max(system.memory.total) - average(system.memory.actual.used.bytes)

空闲内存(不包括缓存)

不包括页面缓存的总可用内存。

字段计算: system.memory.free

内存总量

总内存容量。

字段计算: avg(system.memory.total)

内存使用率 (%)

不包括页面缓存的主内存使用百分比。

这包括所有进程的驻留内存以及内核结构和代码使用的内存(页面缓存除外)。

高水平表示主机的内存饱和情况。例如,100% 表示主内存完全充满了无法回收的内存,除非将其交换出去。

字段计算: average(system.memory.actual.used.pct)

已用内存

不包括页面缓存的主内存使用量。

字段计算: average(system.memory.actual.used.bytes)

日志指标编辑
指标 描述

日志速率

文档计数的累积总和的导数,按 1 秒速率缩放。此指标依赖于与日志相同的索引。

字段计算: cumulative_sum(doc_count)

网络指标编辑
指标 描述

网络入站 (RX)

每秒在主机公共接口上接收的字节数。

字段计算: average(host.network.ingress.bytes) * 8 / (max(metricset.period, kql='host.network.ingress.bytes: *') / 1000)

网络出站 (TX)

每秒在主机公共接口上发送的字节数。

字段计算: average(host.network.egress.bytes) * 8 / (max(metricset.period, kql='host.network.egress.bytes: *') / 1000)

磁盘指标编辑
指标 描述

磁盘延迟

服务磁盘请求所花费的时间。

字段计算: average(system.diskio.read.time + system.diskio.write.time) / (system.diskio.read.count + system.diskio.write.count)

磁盘读取 IOPS

每秒从设备读取操作的平均次数。

字段计算: counter_rate(max(system.diskio.read.count), kql='system.diskio.read.count: *')

磁盘读取吞吐量

每秒从设备读取的平均字节数。

字段计算: counter_rate(max(system.diskio.read.bytes), kql='system.diskio.read.bytes: *')

磁盘使用率 - 可用 (%)

可用磁盘空间的百分比。

字段计算: 1-average(system.filesystem.used.pct)

磁盘使用率 - 最大值 (%)

已用磁盘空间的百分比。高百分比表示磁盘上的分区空间不足。

字段计算: max(system.filesystem.used.pct)

磁盘写入 IOPS

每秒写入设备操作的平均次数。

字段计算: counter_rate(max(system.diskio.write.count), kql='system.diskio.write.count: *')

磁盘写入吞吐量

每秒写入设备的平均字节数。

字段计算: counter_rate(max(system.diskio.write.bytes), kql='system.diskio.write.bytes: *')