从操作系统收集的系统状态指标,如 CPU 和内存使用情况。
process
进程指标。
-
process.state
-
进程状态。例如:"running"。
type: keyword
-
process.cpu.pct
-
自上次事件以来进程使用的 CPU 时间百分比。此值按 CPU 核心数量归一化,范围为 0 到 1。
type: scaled_float
format: percent
-
process.cpu.start_time
-
进程启动时间。
type: date
-
process.memory.pct
-
进程在主内存 (RAM) 中占用的内存百分比。
type: scaled_float
format: percent
system
system
包含本地系统指标。
core
system-core
包含多核系统单个核心的 CPU 指标。
-
system.core.id
-
CPU 核心编号。
type: long
-
system.core.total.pct
-
核心总活跃时间。
type: scaled_float
format: percent
-
system.core.user.pct
-
用户空间中使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.core.user.ticks
-
用户空间中使用的 CPU 时间量。
type: long
-
system.core.system.pct
-
内核空间中使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.core.system.ticks
-
内核空间中使用的 CPU 时间量。
type: long
-
system.core.nice.pct
-
低优先级进程使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.core.nice.ticks
-
低优先级进程使用的 CPU 时间量。
type: long
-
system.core.idle.pct
-
空闲的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.core.idle.ticks
-
空闲的 CPU 时间量。
type: long
-
system.core.iowait.pct
-
等待(磁盘)状态下使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.core.iowait.ticks
-
等待(磁盘)状态下使用的 CPU 时间量。
type: long
-
system.core.irq.pct
-
服务和处理硬件中断所使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.core.irq.ticks
-
服务和处理硬件中断所使用的 CPU 时间量。
type: long
-
system.core.softirq.pct
-
服务和处理软件中断所使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.core.softirq.ticks
-
服务和处理软件中断所使用的 CPU 时间量。
type: long
-
system.core.steal.pct
-
虚拟 CPU 在虚拟机监控程序服务其他处理器时发生的非自愿等待所使用的 CPU 时间百分比。仅在 Unix 上可用。
type: scaled_float
format: percent
-
system.core.steal.ticks
-
虚拟 CPU 在虚拟机监控程序服务其他处理器时发生的非自愿等待所使用的 CPU 时间量。仅在 Unix 上可用。
type: long
-
system.core.model_number
-
CPU 型号编号。仅在 Linux 上可用
type: keyword
-
system.core.model_name
-
CPU 型号名称。仅在 Linux 上可用
type: keyword
-
system.core.mhz
-
CPU 核心当前时钟。仅在 Linux 上可用
type: float
-
system.core.core_id
-
CPU 物理核心 ID。一个核心可以执行多个线程,因此多个
system.core.id
可以共享相同的system.core.core_id
。仅在 Linux 上可用type: keyword
-
system.core.physical_id
-
CPU 核心物理 ID。仅在 Linux 上可用
type: keyword
cpu
cpu
包含本地 CPU 统计信息。
-
system.cpu.cores
-
主机上存在的 CPU 核心数量。非归一化百分比的最大值为
100% * cores
。归一化百分比已考虑此值,最大值为 100%。type: long
-
system.cpu.user.pct
-
用户空间中使用的 CPU 时间百分比。在多核系统上,百分比可能大于 100%。例如,如果 3 个核心使用率为 60%,则
system.cpu.user.pct
将为 180%。type: scaled_float
format: percent
-
system.cpu.system.pct
-
内核空间中使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.nice.pct
-
低优先级进程使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.idle.pct
-
空闲的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.iowait.pct
-
等待(磁盘)状态下使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.irq.pct
-
服务和处理硬件中断所使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.softirq.pct
-
服务和处理软件中断所使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.steal.pct
-
虚拟 CPU 在虚拟机监控程序服务其他处理器时发生的非自愿等待所使用的 CPU 时间百分比。仅在 Unix 上可用。
type: scaled_float
format: percent
-
system.cpu.total.pct
-
除空闲和 IOWait 之外的状态下使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.user.norm.pct
-
用户空间中使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.system.norm.pct
-
内核空间中使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.nice.norm.pct
-
低优先级进程使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.idle.norm.pct
-
空闲的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.iowait.norm.pct
-
等待(磁盘)状态下使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.irq.norm.pct
-
服务和处理硬件中断所使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.softirq.norm.pct
-
服务和处理软件中断所使用的 CPU 时间百分比。
type: scaled_float
format: percent
-
system.cpu.steal.norm.pct
-
虚拟 CPU 在虚拟机监控程序服务其他处理器时发生的非自愿等待所使用的 CPU 时间百分比。仅在 Unix 上可用。
type: scaled_float
format: percent
-
system.cpu.total.norm.pct
-
除空闲和 IOWait 之外的状态下使用的 CPU 时间百分比,按核心数量归一化。
type: scaled_float
format: percent
-
system.cpu.user.ticks
-
用户空间中使用的 CPU 时间量。
type: long
-
system.cpu.system.ticks
-
内核空间中使用的 CPU 时间量。
type: long
-
system.cpu.nice.ticks
-
低优先级进程使用的 CPU 时间量。
type: long
-
system.cpu.idle.ticks
-
空闲的 CPU 时间量。
type: long
-
system.cpu.iowait.ticks
-
等待(磁盘)状态下使用的 CPU 时间量。
type: long
-
system.cpu.irq.ticks
-
服务和处理硬件中断所使用的 CPU 时间量。
type: long
-
system.cpu.softirq.ticks
-
服务和处理软件中断所使用的 CPU 时间量。
type: long
-
system.cpu.steal.ticks
-
虚拟 CPU 在虚拟机监控程序服务其他处理器时发生的非自愿等待所使用的 CPU 时间量。仅在 Unix 上可用。
type: long
diskio
disk
包含从操作系统收集的磁盘 I/O 指标。
-
system.diskio.name
-
磁盘名称。
type: keyword
example: sda1
-
system.diskio.serial_number
-
磁盘的序列号。并非所有操作系统都提供此信息。
type: keyword
-
system.diskio.read.count
-
成功完成的读取总次数。
type: long
-
system.diskio.write.count
-
成功完成的写入总次数。
type: long
-
system.diskio.read.bytes
-
成功读取的字节总数。在 Linux 上,此值为读取的扇区数乘以假定的扇区大小 512。
type: long
format: bytes
-
system.diskio.write.bytes
-
成功写入的字节总数。在 Linux 上,此值为写入的扇区数乘以假定的扇区大小 512。
type: long
format: bytes
-
system.diskio.read.time
-
所有读取所花费的总毫秒数。
type: long
-
system.diskio.write.time
-
所有写入所花费的总毫秒数。
type: long
-
system.diskio.io.time
-
执行 I/O 所花费的总毫秒数。
type: long
-
system.diskio.io.ops
-
正在进行的 I/O 总数。
type: long
entropy
可用的系统熵
-
system.entropy.available_bits
-
可用的熵位数
type: long
-
system.entropy.pct
-
相对于 4096 的池大小,可用熵的百分比
type: scaled_float
format: percent
filesystem
filesystem
包含本地文件系统统计信息。
-
system.filesystem.available
-
非特权用户可用的磁盘空间(以字节为单位)。
type: long
format: bytes
-
system.filesystem.device_name
-
磁盘名称。例如:
/dev/disk1
type: keyword
-
system.filesystem.type
-
磁盘类型。例如:
ext4
。在某些情况下,对于 Windows 操作系统,该值将为unavailable
,因为不允许访问此信息(例如,外部磁盘)。type: keyword
-
system.filesystem.mount_point
-
挂载点。例如:
/
type: keyword
-
system.filesystem.files
-
系统上的 inode 总数,这将是文件、文件夹、符号链接和设备的组合。
type: long
-
system.filesystem.options
-
文件系统挂载上的选项。
type: keyword
-
system.filesystem.free
-
可用的磁盘空间(以字节为单位)。
type: long
format: bytes
-
system.filesystem.free_files
-
文件系统中空闲的 inode 数量。
type: long
-
system.filesystem.total
-
总磁盘空间(以字节为单位)。
type: long
format: bytes
-
system.filesystem.used.bytes
-
已使用的磁盘空间(以字节为单位)。
type: long
format: bytes
-
system.filesystem.used.pct
-
已使用的磁盘空间百分比。
type: scaled_float
format: percent
fsstat
system.fsstat
包含从所有已挂载文件系统汇总的文件系统指标。
-
system.fsstat.count
-
找到的文件系统数量。
type: long
-
system.fsstat.total_files
-
系统上的 inode 总数,这将是文件、文件夹、符号链接和设备的组合。不在 Windows 上。
type: long
total_size
嵌套的文件系统文档。
-
system.fsstat.total_size.free
-
总空闲空间。
type: long
format: bytes
-
system.fsstat.total_size.used
-
总已使用空间。
type: long
format: bytes
-
system.fsstat.total_size.total
-
总空间(已使用和空闲)。
type: long
format: bytes
load
CPU 负载平均值。
-
system.load.1
-
最近一分钟的负载平均值。
type: scaled_float
-
system.load.5
-
最近 5 分钟的负载平均值。
type: scaled_float
-
system.load.15
-
最近 15 分钟的负载平均值。
type: scaled_float
-
system.load.norm.1
-
最近一分钟的负载除以核心数量。
type: scaled_float
-
system.load.norm.5
-
最近 5 分钟的负载除以核心数量。
type: scaled_float
-
system.load.norm.15
-
最近 15 分钟的负载除以核心数量。
type: scaled_float
-
system.load.cores
-
主机上存在的 CPU 核心数量。
type: long
memory
memory
包含本地内存统计信息。
-
system.memory.total
-
总内存。
type: long
format: bytes
-
system.memory.used.bytes
-
已使用内存。
type: long
format: bytes
-
system.memory.free
-
空闲内存总量(以字节为单位)。此值不包括系统缓存和缓冲区消耗的内存(请参见 system.memory.actual.free)。
type: long
format: bytes
-
system.memory.cached
-
系统上的总缓存内存。
type: long
format: bytes
-
system.memory.used.pct
-
已使用内存的百分比。
type: scaled_float
format: percent
actual
实际使用的内存和空闲内存。
-
system.memory.actual.used.bytes
-
实际使用的内存(以字节为单位)。它表示总内存和可用内存之间的差值。可用内存取决于操作系统。有关更多详细信息,请检查
system.actual.free
。type: long
format: bytes
-
system.memory.actual.free
-
实际空闲内存(以字节为单位)。它是根据操作系统计算的。在 Linux 上,此值将来自 /proc/meminfo 中的 MemAvailable,或者如果 /proc/meminfo 不可用,则从空闲内存加上缓存和缓冲区计算。在 OSX 上,它是空闲内存和非活动内存的总和。在 Windows 上,它等于
system.memory.free
。type: long
format: bytes
-
system.memory.actual.used.pct
-
实际使用的内存百分比。
type: scaled_float
format: percent
swap
此组包含与系统上交换内存使用情况相关的统计信息。
-
system.memory.swap.total
-
总交换内存。
type: long
format: bytes
-
system.memory.swap.used.bytes
-
已使用的交换内存。
type: long
format: bytes
-
system.memory.swap.free
-
可用的交换内存。
type: long
format: bytes
-
system.memory.swap.used.pct
-
已使用的交换内存的百分比。
type: scaled_float
format: percent
network
network
包含单个网络接口的网络 I/O 指标。
-
system.network.name
-
网络接口名称。
type: keyword
example: eth0
-
system.network.out.bytes
-
发送的字节数。
type: long
format: bytes
-
system.network.in.bytes
-
接收的字节数。
type: long
format: bytes
-
system.network.out.packets
-
发送的数据包数量。
type: long
-
system.network.in.packets
-
接收的数据包数量。
type: long
-
system.network.in.errors
-
接收时的错误数量。
type: long
-
system.network.out.errors
-
发送时的错误数量。
type: long
-
system.network.in.dropped
-
被丢弃的传入数据包数量。
type: long
-
system.network.out.dropped
-
被丢弃的传出数据包数量。此值在 Darwin 和 BSD 上始终为 0,因为它没有被操作系统报告。
type: long
network_summary
与全局网络活动相关的指标
-
system.network_summary.ip.*
-
IP 计数器
type: object
-
system.network_summary.tcp.*
-
TCP 计数器
type: object
-
system.network_summary.udp.*
-
UDP 计数器
type: object
-
system.network_summary.udp_lite.*
-
UDP Lite 计数器
type: object
-
system.network_summary.icmp.*
-
ICMP 计数器
type: object
process
process
包含进程元数据、CPU 指标和内存指标。
-
system.process.name
-
type: alias
alias to: process.name
-
system.process.state
-
进程状态。例如:"running"。
type: keyword
-
system.process.pid
-
type: alias
alias to: process.pid
-
system.process.ppid
-
type: alias
alias to: process.parent.pid
-
system.process.pgid
-
type: alias
alias to: process.pgid
-
system.process.num_threads
-
进程中的线程数量
type: integer
-
system.process.cmdline
-
用于启动进程的完整命令行,包括用空格分隔的参数。
type: keyword
-
system.process.username
-
type: alias
alias to: user.name
-
system.process.cwd
-
type: alias
alias to: process.working_directory
-
system.process.env
-
用于启动进程的环境变量。数据在 FreeBSD、Linux 和 OS X 上可用。
type: object
cpu
每个进程的 CPU 特定统计信息。
-
system.process.cpu.user.ticks
-
进程在用户空间花费的 CPU 时间量。
type: long
-
system.process.cpu.total.value
-
进程启动后 CPU 使用量的值。
type: long
-
system.process.cpu.total.pct
-
进程自上次更新以来所花费的 CPU 时间百分比。它的值类似于 Unix 系统上 top 命令显示的进程的 %CPU 值。
type: scaled_float
format: percent
-
system.process.cpu.total.norm.pct
-
进程自上次事件以来所花费的 CPU 时间百分比。此值已根据 CPU 内核数量进行标准化,范围为 0 到 100%。
type: scaled_float
format: percent
-
system.process.cpu.system.ticks
-
进程在内核空间花费的 CPU 时间量。
type: long
-
system.process.cpu.total.ticks
-
进程花费的总 CPU 时间。
type: long
-
system.process.cpu.start_time
-
进程启动时间。
type: date
内存
每个进程的内存特定统计信息。
-
system.process.memory.size
-
进程拥有的总虚拟内存。在 Windows 上,这代表了此进程的提交费用(内存管理器已为此进程提交的内存总量)值,以字节为单位。
type: long
format: bytes
-
system.process.memory.rss.bytes
-
常驻集大小。进程在主内存(RAM)中占用的内存量。在 Windows 上,这表示当前工作集大小,以字节为单位。
type: long
format: bytes
-
system.process.memory.rss.pct
-
进程在主内存 (RAM) 中占用的内存百分比。
type: scaled_float
format: percent
-
system.process.memory.share
-
进程使用的共享内存。
type: long
format: bytes
IO
磁盘 I/O 指标,从 /proc/[PID]/io 转发。仅在 Linux 上可用。
-
system.process.io.cancelled_write_bytes
-
此进程取消或导致未写入的字节数。
type: long
-
system.process.io.read_bytes
-
从存储层获取的字节数。
type: long
-
system.process.io.write_bytes
-
写入存储层的字节数。
type: long
-
system.process.io.read_char
-
从 read(2) 和类似的系统调用中读取的字节数。
type: long
-
system.process.io.write_char
-
发送到系统调用以进行写入的字节数。
type: long
-
system.process.io.read_ops
-
与读取相关的系统调用的计数。
type: long
-
system.process.io.write_ops
-
与写入相关的系统调用的计数。
type: long
文件描述符
文件描述符使用指标。此指标集适用于 Linux 和 FreeBSD。
-
system.process.fd.open
-
进程打开的文件描述符数量。
type: long
-
system.process.fd.limit.soft
-
进程打开的文件描述符数量的软限制。进程可以随时更改软限制。
type: long
-
system.process.fd.limit.hard
-
进程打开的文件描述符数量的硬限制。只有 root 才能提高硬限制。
type: long
控制组
任务所属控制组的指标和限制。当进程属于非根控制组时,会报告控制组指标。这些指标仅在 Linux 上可用。
-
system.process.cgroup.id
-
与此任务关联的所有控制组共有的 ID。如果所有控制组都没有使用公共 ID,则此字段将不存在。
type: keyword
-
system.process.cgroup.path
-
相对于控制组子系统挂载点的控制组路径。如果所有控制组都没有使用公共路径,则此字段将不存在。
type: keyword
-
system.process.cgroup.cgroups_version
-
为进程报告的控制组版本
type: long
CPU
CPU 子系统为控制组中的任务安排 CPU 访问。访问可以通过两个独立的调度程序 CFS 和 RT 来控制。CFS 代表完全公平调度程序,它根据权重在控制组之间按比例分配 CPU 时间。RT 代表实时调度程序,它设置控制组中进程在给定时间段内可以消耗的最大 CPU 时间量。在控制组 V2 下的 CPU 中,控制组与来自 cpuacct 的许多指标合并。此外,V2 中的每个调度程序指标都消失了。
-
system.process.cgroup.cpu.id
-
控制组的 ID。
type: keyword
-
system.process.cgroup.cpu.path
-
相对于控制组子系统挂载点的控制组路径。
type: keyword
统计信息
控制组 v2 统计信息
-
system.process.cgroup.cpu.stats.usage.ns
-
控制组 v2 使用量(以纳秒为单位)
type: long
-
system.process.cgroup.cpu.stats.usage.pct
-
控制组 v2 使用量
type: float
-
system.process.cgroup.cpu.stats.usage.norm.pct
-
控制组 v2 标准化使用量
type: float
-
system.process.cgroup.cpu.stats.user.ns
-
控制组 v2 CPU 用户时间(以纳秒为单位)
type: long
-
system.process.cgroup.cpu.stats.user.pct
-
控制组 v2 CPU 用户时间
type: float
-
system.process.cgroup.cpu.stats.user.norm.pct
-
控制组 v2 标准化 CPU 用户时间
type: float
-
system.process.cgroup.cpu.stats.system.ns
-
控制组 v2 系统时间(以纳秒为单位)
type: long
-
system.process.cgroup.cpu.stats.system.pct
-
控制组 v2 系统时间
type: float
-
system.process.cgroup.cpu.stats.system.norm.pct
-
控制组 v2 标准化系统时间
type: float
-
system.process.cgroup.cpu.cfs.period.us
-
以微秒为单位的时间段,用于控制组对 CPU 资源的访问应以多长时间重新分配一次。
type: long
-
system.process.cgroup.cpu.cfs.quota.us
-
控制组中所有任务在一个周期内(由 cfs.period.us 定义)可以运行的总时间量,以微秒为单位。
type: long
-
system.process.cgroup.cpu.cfs.shares
-
一个整数值,指定可用于控制组中任务的 CPU 时间的相对份额。cpu.shares 文件中指定的值必须大于或等于 2。
type: long
-
system.process.cgroup.cpu.rt.period.us
-
以微秒为单位的时间段,用于控制组对 CPU 资源的访问以多长时间重新分配一次。
type: long
-
system.process.cgroup.cpu.rt.runtime.us
-
以微秒为单位的时间段,表示控制组中任务可以持续访问 CPU 资源的最长时间段。
type: long
-
system.process.cgroup.cpu.stats.periods
-
已经过去的时间段间隔(由 cpu.cfs.period.us 指定)的次数。
type: long
-
system.process.cgroup.cpu.stats.throttled.periods
-
控制组中任务被限制(即,由于已用尽所有可用时间,如配额所指定,因此不允许运行)的次数。
type: long
-
system.process.cgroup.cpu.stats.throttled.us
-
控制组中任务被限制的总时间段(以微秒为单位),如控制组 v2 所报告。
type: long
-
system.process.cgroup.cpu.stats.throttled.ns
-
控制组中任务被限制的总时间段(以纳秒为单位)。
type: long
压力
压力(资源争用)统计信息。
一些
至少有一些任务在给定资源上停滞的时间份额
-
system.process.cgroup.cpu.pressure.some.10.pct
-
10 秒内的压力
type: float
format: percent
-
system.process.cgroup.cpu.pressure.some.60.pct
-
60 秒内的压力
type: float
format: percent
-
system.process.cgroup.cpu.pressure.some.300.pct
-
300 秒内的压力
type: float
format: percent
-
system.process.cgroup.cpu.pressure.some.total
-
总的一些压力时间
type: long
format: percent
全部
所有非空闲任务同时在给定资源上停滞的时间份额
-
system.process.cgroup.cpu.pressure.full.10.pct
-
10 秒内的压力
type: float
format: percent
-
system.process.cgroup.cpu.pressure.full.60.pct
-
60 秒内的压力
type: float
format: percent
-
system.process.cgroup.cpu.pressure.full.300.pct
-
300 秒内的压力
type: float
format: percent
-
system.process.cgroup.cpu.pressure.full.total
-
总的全部压力时间
type: long
CPU 统计
CPU 统计指标。
-
system.process.cgroup.cpuacct.id
-
控制组的 ID。
type: keyword
-
system.process.cgroup.cpuacct.path
-
相对于控制组子系统挂载点的控制组路径。
type: keyword
-
system.process.cgroup.cpuacct.total.ns
-
控制组中所有任务消耗的总 CPU 时间(以纳秒为单位)。
type: long
-
system.process.cgroup.cpuacct.total.pct
-
控制组的 CPU 时间占总 CPU 时间的百分比。
type: scaled_float
-
system.process.cgroup.cpuacct.total.norm.pct
-
控制组的 CPU 时间占总 CPU 时间的百分比,按 CPU 数量进行标准化。这实际上是各个 CPU 上花费时间的平均值。
type: scaled_float
-
system.process.cgroup.cpuacct.stats.user.ns
-
任务在用户模式下消耗的 CPU 时间。
type: long
-
system.process.cgroup.cpuacct.stats.user.pct
-
控制组在用户空间花费的时间,占总 CPU 时间的百分比
type: scaled_float
-
system.process.cgroup.cpuacct.stats.user.norm.pct
-
控制组在用户空间花费的时间,占总 CPU 时间的百分比,按 CPU 数量进行标准化。
type: scaled_float
-
system.process.cgroup.cpuacct.stats.system.ns
-
任务在用户(内核)模式下消耗的 CPU 时间。
type: long
-
system.process.cgroup.cpuacct.stats.system.pct
-
控制组在内核空间花费的时间,占总 CPU 时间的百分比
type: scaled_float
-
system.process.cgroup.cpuacct.stats.system.norm.pct
-
控制组在内核空间花费的时间,占总 CPU 时间的百分比,按 CPU 数量进行标准化。
type: scaled_float
-
system.process.cgroup.cpuacct.percpu
-
此控制组中所有任务在每个 CPU 上消耗的 CPU 时间(以纳秒为单位)。
type: object
内存
内存限制和指标。
-
system.process.cgroup.memory.id
-
控制组的 ID。
type: keyword
-
system.process.cgroup.memory.path
-
相对于控制组子系统挂载点的控制组路径。
type: keyword
-
system.process.cgroup.memory.mem.usage.bytes
-
控制组中进程的总内存使用量(以字节为单位)。
type: long
format: bytes
-
system.process.cgroup.memory.mem.usage.max.bytes
-
控制组中进程使用的最大内存量(以字节为单位)。
type: long
format: bytes
-
system.process.cgroup.memory.mem.limit.bytes
-
控制组中任务允许使用的最大用户内存量(包括文件缓存),以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.mem.failures
-
达到内存限制(mem.limit.bytes)的次数。
type: long
-
system.process.cgroup.memory.mem.low.bytes
-
内存低阈值
type: long
format: bytes
-
system.process.cgroup.memory.mem.high.bytes
-
内存高阈值
type: long
format: bytes
-
system.process.cgroup.memory.mem.max.bytes
-
内存最大阈值
type: long
format: bytes
mem.events
控制器触发的给定使用级别的次数
-
system.process.cgroup.memory.mem.events.low
-
低阈值
type: long
-
system.process.cgroup.memory.mem.events.high
-
高阈值
type: long
-
system.process.cgroup.memory.mem.events.max
-
最大阈值
type: long
-
system.process.cgroup.memory.mem.events.oom
-
oom 阈值
type: long
-
system.process.cgroup.memory.mem.events.oom_kill
-
oom 杀手阈值
type: long
-
system.process.cgroup.memory.mem.events.fail
-
失败阈值
type: long
-
system.process.cgroup.memory.memsw.usage.bytes
-
控制组中进程的当前内存使用量加上交换空间使用的总和(以字节为单位)。
type: long
format: bytes
-
system.process.cgroup.memory.memsw.usage.max.bytes
-
控制组中进程使用的最大内存和交换空间量(以字节为单位)。
type: long
format: bytes
-
system.process.cgroup.memory.memsw.limit.bytes
-
控制组中任务允许使用的内存和交换空间使用量的总和的最大值。
type: long
format: bytes
-
system.process.cgroup.memory.memsw.low.bytes
-
内存低阈值
type: long
format: bytes
-
system.process.cgroup.memory.memsw.high.bytes
-
内存高阈值
type: long
format: bytes
-
system.process.cgroup.memory.memsw.max.bytes
-
内存最大阈值
type: long
format: bytes
-
system.process.cgroup.memory.memsw.failures
-
达到内存加交换空间限制(memsw.limit.bytes)的次数。
type: long
memsw.events
控制器触发的给定使用级别的次数
-
system.process.cgroup.memory.memsw.events.low
-
低阈值
type: long
-
system.process.cgroup.memory.memsw.events.high
-
高阈值
type: long
-
system.process.cgroup.memory.memsw.events.max
-
最大阈值
type: long
-
system.process.cgroup.memory.memsw.events.oom
-
oom 阈值
type: long
-
system.process.cgroup.memory.memsw.events.oom_kill
-
oom 杀手阈值
type: long
-
system.process.cgroup.memory.memsw.events.fail
-
失败阈值
type: long
-
system.process.cgroup.memory.kmem.usage.bytes
-
控制组中进程的总内核内存使用量(以字节为单位)。
type: long
format: bytes
-
system.process.cgroup.memory.kmem.usage.max.bytes
-
控制组中进程使用的最大内核内存量(以字节为单位)。
type: long
format: bytes
-
system.process.cgroup.memory.kmem.limit.bytes
-
控制组中任务允许使用的最大内核内存量。
type: long
format: bytes
-
system.process.cgroup.memory.kmem.failures
-
达到内存限制(kmem.limit.bytes)的次数。
type: long
-
system.process.cgroup.memory.kmem_tcp.usage.bytes
-
TCP 缓冲区的总内存使用量,以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.kmem_tcp.usage.max.bytes
-
控制组中进程使用的 TCP 缓冲区的最大内存量(以字节为单位)。
type: long
format: bytes
-
system.process.cgroup.memory.kmem_tcp.limit.bytes
-
控制组中任务允许使用的 TCP 缓冲区的最大内存量。
type: long
format: bytes
-
system.process.cgroup.memory.kmem_tcp.failures
-
达到内存限制(kmem_tcp.limit.bytes)的次数。
type: long
-
system.process.cgroup.memory.stats.*
-
详细的内存 IO 统计信息
type: object
-
system.process.cgroup.memory.stats.*.bytes
-
详细的内存 IO 统计信息
type: object
-
system.process.cgroup.memory.stats.active_anon.bytes
-
活动最不常使用(LRU)列表上的匿名和交换缓存,包括 tmpfs(shmem),以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.active_file.bytes
-
活动 LRU 列表上的文件支持内存,以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.cache.bytes
-
页面缓存,包括 tmpfs(shmem),以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.hierarchical_memory_limit.bytes
-
包含内存控制组的层次结构的内存限制,以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.hierarchical_memsw_limit.bytes
-
包含内存控制组的层次结构的内存加交换限制,以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.inactive_anon.bytes
-
非活动 LRU 列表上的匿名和交换缓存,包括 tmpfs(shmem),以字节为单位
type: long
format: bytes
-
system.process.cgroup.memory.stats.inactive_file.bytes
-
非活动 LRU 列表上的文件支持内存,以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.mapped_file.bytes
-
内存映射文件的大小,包括 tmpfs(shmem),以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.page_faults
-
控制组中进程触发页面错误的次数。
type: long
-
system.process.cgroup.memory.stats.major_page_faults
-
cgroup 中某个进程触发重大错误的次数。 “重大”错误发生在内核需要实际从磁盘读取数据时。
type: long
-
system.process.cgroup.memory.stats.pages_in
-
分页到内存中的页数。这是一个计数器。
type: long
-
system.process.cgroup.memory.stats.pages_out
-
从内存中分页的页数。这是一个计数器。
type: long
-
system.process.cgroup.memory.stats.rss.bytes
-
匿名和交换缓存(包括透明巨页),不包括 tmpfs(shmem),以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.rss_huge.bytes
-
匿名透明巨页的字节数。
type: long
format: bytes
-
system.process.cgroup.memory.stats.swap.bytes
-
交换使用量,以字节为单位。
type: long
format: bytes
-
system.process.cgroup.memory.stats.unevictable.bytes
-
无法回收的内存,以字节为单位。
type: long
format: bytes
blkio
块 IO 指标。
-
system.process.cgroup.blkio.id
-
控制组的 ID。
type: keyword
-
system.process.cgroup.blkio.path
-
相对于 cgroup 子系统挂载点的 cgroup 路径。
type: keyword
-
system.process.cgroup.blkio.total.bytes
-
cgroup 中进程对所有块设备进行的总传输字节数。
type: long
format: bytes
-
system.process.cgroup.blkio.total.ios
-
cgroup 中进程对所有设备执行的总 I/O 操作数,如节流策略所见。
type: long
io
cgroup V2 IO 指标,替换 blkio。
-
system.process.cgroup.io.id
-
控制组的 ID。
type: keyword
-
system.process.cgroup.io.path
-
相对于 cgroup 子系统挂载点的 cgroup 路径。
type: keyword
-
system.process.cgroup.io.stats.*
-
每个设备的 IO 使用情况统计信息
type: object
-
system.process.cgroup.io.stats.*.*
-
type: object
-
system.process.cgroup.io.stats.*.*.bytes
-
每个设备的 IO 使用情况统计信息
type: object
-
system.process.cgroup.io.stats.*.*.ios
-
每个设备的 IO 使用情况统计信息
type: object
pressure
压力(资源争用)统计信息。
full
至少有一些任务在给定资源上停滞的时间份额
-
system.process.cgroup.io.pressure.full.10.pct
-
10 秒内的压力
type: float
format: percent
-
system.process.cgroup.io.pressure.full.60.pct
-
60 秒内的压力
type: float
format: percent
-
system.process.cgroup.io.pressure.full.300.pct
-
300 秒内的压力
type: float
format: percent
-
system.process.cgroup.io.pressure.full.total
-
总的一些压力时间
type: long
some
所有任务在给定资源上被阻塞的时间比例
-
system.process.cgroup.io.pressure.some.10.pct
-
10 秒内的压力
type: float
format: percent
-
system.process.cgroup.io.pressure.some.60.pct
-
60 秒内的压力
type: float
format: percent
-
system.process.cgroup.io.pressure.some.300.pct
-
300 秒内的压力
type: float
-
system.process.cgroup.io.pressure.some.total
-
总的一些压力时间
type: long
process.summary
主机上运行的进程的摘要指标。
-
system.process.summary.total
-
此主机上的进程总数。
type: long
-
system.process.summary.running
-
此主机上正在运行的进程数。
type: long
-
system.process.summary.idle
-
此主机上空闲的进程数。
type: long
-
system.process.summary.sleeping
-
此主机上休眠的进程数。
type: long
-
system.process.summary.stopped
-
此主机上已停止的进程数。
type: long
-
system.process.summary.zombie
-
此主机上僵尸进程数。
type: long
-
system.process.summary.dead
-
此主机上已死亡的进程数。 这种情况很少出现,但在某些特殊情况下可能会发生。
type: long
-
system.process.summary.wakekill
-
此主机上处于 wakekill 状态的进程数。 仅在较旧的 Linux 内核版本中找到。
type: long
-
system.process.summary.wake
-
此主机上处于唤醒状态的进程数。 仅在较旧的 Linux 内核版本中找到。
type: long
-
system.process.summary.parked
-
此主机上处于停放状态的进程数。 仅在较旧的 Linux 内核版本中找到,或在某些条件下。
type: long
-
system.process.summary.unknown
-
无法检索状态或状态未知的进程数。
type: long
threads
系统中单个线程的计数。
-
system.process.summary.threads.running
-
当前正在运行的线程数。
type: long
-
system.process.summary.threads.blocked
-
被 I/O 阻塞的线程数。
type: long
raid
raid
-
system.raid.name
-
设备的名称。
type: keyword
-
system.raid.status
-
设备的活动状态。
type: keyword
-
system.raid.level
-
设备的 RAID 等级
type: keyword
-
system.raid.sync_action
-
当前同步操作,如果 RAID 阵列是冗余的
type: keyword
-
system.raid.disks.active
-
活动磁盘数量。
type: long
-
system.raid.disks.total
-
设备包含的磁盘总数。
type: long
-
system.raid.disks.spare
-
备用磁盘数量。
type: long
-
system.raid.disks.failed
-
故障磁盘数量。
type: long
-
system.raid.disks.states.*
-
原始磁盘状态映射
type: object
-
system.raid.blocks.total
-
设备包含的块数,以 1024 字节块为单位。
type: long
-
system.raid.blocks.synced
-
设备上同步的块数,以 1024 字节块为单位。
type: long
service
系统服务的指标
-
system.service.name
-
服务的名称
type: keyword
-
system.service.load_state
-
服务的加载状态
type: keyword
-
system.service.state
-
服务的活动状态
type: keyword
-
system.service.sub_state
-
服务的子状态
type: keyword
-
system.service.state_since
-
上次状态更改的时间戳。 如果服务处于活动状态并正在运行,则这是其运行时间。
type: date
-
system.service.exec_code
-
服务主进程的 SIGCHLD 代码
type: keyword
-
system.service.unit_file.state
-
单元文件的状态
type: keyword
-
system.service.unit_file.vendor_preset
-
单元文件的默认状态
type: keyword
resources
与服务相关的系统指标
-
system.service.resources.cpu.usage.ns
-
CPU 使用量,以纳秒为单位
type: long
-
system.service.resources.memory.usage.bytes
-
内存使用量,以字节为单位
type: long
-
system.service.resources.tasks.count
-
与服务相关的任务数量
type: long
network
网络资源使用情况
-
system.service.resources.network.in.bytes
-
传入字节数
type: long
format: bytes
-
system.service.resources.network.in.packets
-
传入数据包数
type: long
format: bytes
-
system.service.resources.network.out.packets
-
传出数据包数
type: long
-
system.service.resources.network.out.bytes
-
传出字节数
type: long
socket
处于活动状态的 TCP 套接字。
-
system.socket.direction
-
type: alias
别名为:network.direction
-
system.socket.family
-
type: alias
别名为:network.type
-
system.socket.local.ip
-
本地 IP 地址。 这可以是 IPv4 或 IPv6 地址。
类型:ip
示例:192.0.2.1 或 2001:0DB8:ABED:8536::1
-
system.socket.local.port
-
本地端口。
type: long
示例:22
-
system.socket.remote.ip
-
远程 IP 地址。 这可以是 IPv4 或 IPv6 地址。
类型:ip
示例:192.0.2.1 或 2001:0DB8:ABED:8536::1
-
system.socket.remote.port
-
远程端口。
type: long
示例:22
-
system.socket.remote.host
-
与远程 IP 关联的 PTR 记录。 它通过反向 IP 查找获得。
type: keyword
示例:76-211-117-36.nw.example.com。
-
system.socket.remote.etld_plus_one
-
远程主机的有效顶级域 (eTLD) 加上一个标签。 例如,"foo.bar.golang.org." 的 eTLD+1 是 "golang.org."。 用于确定 eTLD 的数据来自嵌入的 http://publicsuffix.org 数据副本。
type: keyword
示例:example.com.
-
system.socket.remote.host_error
-
描述反向查找失败原因的错误。
type: keyword
-
system.socket.process.pid
-
type: alias
alias to: process.pid
-
system.socket.process.command
-
type: alias
alias to: process.name
-
system.socket.process.cmdline
-
完整的命令行
type: keyword
-
system.socket.process.exe
-
type: alias
别名为:process.executable
-
system.socket.user.id
-
type: alias
别名为:user.id
-
system.socket.user.name
-
type: alias
别名为:user.full_name
socket.summary
主机系统中打开的套接字的摘要指标
all
所有连接
-
system.socket.summary.all.count
-
所有打开的连接
type: integer
-
system.socket.summary.all.listening
-
所有侦听端口
type: integer
tcp
所有 TCP 连接
-
system.socket.summary.tcp.memory
-
TCP 套接字使用的内存量(以字节为单位),基于已分配的页面数和系统页面大小。 对应于 /proc/sys/net/ipv4/tcp_mem 中设置的限制。 仅在 Linux 上可用。
type: integer
format: bytes
all
所有 TCP 连接
-
system.socket.summary.tcp.all.orphan
-
所有孤立 TCP 套接字的计数。 仅在 Linux 上可用。
type: integer
-
system.socket.summary.tcp.all.count
-
所有打开的 TCP 连接
type: integer
-
system.socket.summary.tcp.all.listening
-
所有 TCP 侦听端口
type: integer
-
system.socket.summary.tcp.all.established
-
已建立的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.close_wait
-
处于 close_wait 状态的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.time_wait
-
处于 time_wait 状态的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.syn_sent
-
处于 syn_sent 状态的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.syn_recv
-
处于 syn_recv 状态的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.fin_wait1
-
处于 fin_wait1 状态的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.fin_wait2
-
处于 fin_wait2 状态的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.last_ack
-
处于 last_ack 状态的 TCP 连接数
type: integer
-
system.socket.summary.tcp.all.closing
-
处于 closing 状态的 TCP 连接数
type: integer
udp
所有 UDP 连接
-
system.socket.summary.udp.memory
-
UDP 套接字使用的内存量(以字节为单位),基于已分配的页面数和系统页面大小。 对应于 /proc/sys/net/ipv4/udp_mem 中设置的限制。 仅在 Linux 上可用。
type: integer
format: bytes
all
所有 UDP 连接
-
system.socket.summary.udp.all.count
-
所有打开的 UDP 连接
type: integer
uptime
uptime
包含操作系统运行时间指标。
-
system.uptime.duration.ms
-
OS 运行时间,以毫秒为单位。
type: long
格式:duration
users
已登录的用户会话数据
-
system.users.id
-
会话的 ID
type: keyword
-
system.users.seat
-
关联的 logind 座位
type: keyword
-
system.users.path
-
会话的 DBus 对象路径
type: keyword
-
system.users.type
-
用户会话的类型
type: keyword
-
system.users.service
-
与服务关联的会话
type: keyword
-
system.users.remote
-
指示远程会话的布尔值
类型:boolean
-
system.users.state
-
会话的当前状态
type: keyword
-
system.users.scope
-
关联的 systemd 范围
type: keyword
-
system.users.leader
-
会话的根 PID
type: long
-
system.users.remote_host
-
会话的远程主机地址
type: keyword