cat异常检测器API
编辑cat异常检测器API
编辑cat API仅供使用命令行或Kibana控制台的人员使用。它们不适用于应用程序。对于应用程序使用,请使用获取异常检测作业统计信息API。
返回有关异常检测作业的配置和使用信息。
前提条件
编辑路径参数
编辑-
<job_id>
- (可选,字符串)异常检测作业的标识符。
查询参数
编辑-
allow_no_match
-
(可选,布尔值)指定当请求
- 包含通配符表达式且没有匹配的作业时该怎么做。
- 包含
_all
字符串或没有标识符且没有匹配项时。 - 包含通配符表达式且只有部分匹配时。
默认值为
true
,当没有匹配项时返回一个空的jobs
数组,当有部分匹配项时返回结果子集。如果此参数为false
,则当没有匹配项或只有部分匹配项时,请求返回404
状态码。 -
bytes
- (可选,字节大小单位)用于显示字节值的单位。
-
format
- (可选,字符串)HTTP accept header的简短版本。有效值包括JSON、YAML等。
-
h
-
(可选,字符串)要显示的列名称的逗号分隔列表。
如果不指定要包含哪些列,则API返回默认列。如果显式指定一个或多个列,则只返回指定的列。
有效列为
-
assignment_explanation
、ae
- 仅对于开放的异常检测作业,包含与选择运行作业的节点相关的消息。
-
buckets.count
、bc
、bucketsCount
- (默认)作业生成的桶结果数。
-
buckets.time.exp_avg
、btea
、bucketsTimeExpAvg
- 所有桶处理时间的指数移动平均值,以毫秒为单位。
-
buckets.time.exp_avg_hour
、bteah
、bucketsTimeExpAvgHour
- 在1小时时间窗口内计算的桶处理时间的指数加权移动平均值,以毫秒为单位。
-
buckets.time.max
、btmax
、bucketsTimeMax
- 所有桶处理时间中的最大值,以毫秒为单位。
-
buckets.time.min
、btmin
、bucketsTimeMin
- 所有桶处理时间中的最小值,以毫秒为单位。
-
buckets.time.total
、btt
、bucketsTimeTotal
- 所有桶处理时间的总和,以毫秒为单位。
-
data.buckets
、db
、dataBuckets
- 已处理的桶数。
-
data.earliest_record
、der
、dataEarliestRecord
- 最早按时间顺序输入文档的时间戳。
-
data.empty_buckets
、deb
、dataEmptyBuckets
- 不包含任何数据的桶数。如果您的数据包含许多空桶,请考虑增加
bucket_span
或使用对数据间隙容忍的函数,例如mean
、non_null_sum
或non_zero_count
。 -
data.input_bytes
、dib
、dataInputBytes
- 发布到异常检测作业的输入数据字节数。
-
data.input_fields
、dif
、dataInputFields
- 发布到异常检测作业的输入文档中的字段总数。此计数包括分析中未使用的字段。但是,请注意,如果您使用的是数据馈送,它会在将检索到的文档发布到作业之前仅提取所需的字段。
-
data.input_records
、dir
、dataInputRecords
- 发布到异常检测作业的输入文档数。
-
data.invalid_dates
、did
、dataInvalidDates
- 缺少日期字段或无法解析的日期的输入文档数。
-
data.last
、dl
、dataLast
- 根据服务器时间,最后分析数据的的时间戳。
-
data.last_empty_bucket
、dleb
、dataLastEmptyBucket
- 不包含任何数据的最后一个桶的时间戳。
-
data.last_sparse_bucket
、dlsb
、dataLastSparseBucket
- 被认为是稀疏的最后一个桶的时间戳。
-
data.latest_record
、dlr
、dataLatestRecord
- 最新按时间顺序输入文档的时间戳。
-
data.missing_fields
、dmf
、dataMissingFields
-
缺少异常检测作业配置为分析的字段的输入文档数。仍然会处理缺少字段的输入文档,因为并非所有字段都可能缺少。
如果您使用的是数据馈送或以JSON格式将数据发布到作业,则较高的
missing_field_count
通常并不表示数据问题。它不一定是令人担忧的原因。 -
data.out_of_order_timestamps
、doot
、dataOutOfOrderTimestamps
- 时间戳在当前异常检测桶开始时间之前(按延迟窗口偏移)的输入文档数。此信息仅在您使用发布数据API向异常检测作业提供数据时适用。这些乱序文档将被丢弃,因为作业需要按升序时间顺序排列的时间序列数据。
-
data.processed_fields
、dpf
、dataProcessedFields
- 异常检测作业已处理的所有文档中的字段总数。只有检测器配置对象中指定的字段才计入此计数。时间戳不包含在此计数中。
-
data.processed_records
、dpr
、dataProcessedRecords
- (默认)异常检测作业已处理的输入文档数。此值包括缺少字段的文档,因为它们仍然会被分析。如果您使用数据馈送并在搜索查询中进行聚合,则
processed_record_count
是已处理的聚合结果数,而不是Elasticsearch文档数。 -
data.sparse_buckets
、dsb
、dataSparseBuckets
- 与预期数据点数相比,包含少量数据点的桶数。如果您的数据包含许多稀疏桶,请考虑使用更长的
bucket_span
。 -
forecasts.memory.avg
、fmavg
、forecastsMemoryAvg
- 与异常检测作业相关的预测的平均内存使用量(字节)。
-
forecasts.memory.max
、fmmax
、forecastsMemoryMax
- 与异常检测作业相关的预测的最大内存使用量(字节)。
-
forecasts.memory.min
、fmmin
、forecastsMemoryMin
- 与异常检测作业相关的预测的最小内存使用量(字节)。
-
forecasts.memory.total
、fmt
、forecastsMemoryTotal
- 与异常检测作业相关的预测的总内存使用量(字节)。
-
forecasts.records.avg
、fravg
、forecastsRecordsAvg
- 为与异常检测作业相关的预测写入的
model_forecast
文档的平均数量。 -
forecasts.records.max
、frmax
、forecastsRecordsMax
- 为与异常检测作业相关的预测写入的
model_forecast
文档的最大数量。 -
forecasts.records.min
、frmin
、forecastsRecordsMin
- 为与异常检测作业相关的预测写入的
model_forecast
文档的最小数量。 -
forecasts.records.total
、frt
、forecastsRecordsTotal
- 为与异常检测作业相关的预测写入的
model_forecast
文档的总数。 -
forecasts.time.avg
、ftavg
、forecastsTimeAvg
- 与异常检测作业相关的预测的平均运行时间(毫秒)。
-
forecasts.time.max
、ftmax
、forecastsTimeMax
- 与异常检测作业相关的预测的最大运行时间(毫秒)。
-
forecasts.time.min
、ftmin
、forecastsTimeMin
- 与异常检测作业相关的预测的最小运行时间(毫秒)。
-
forecasts.time.total
、ftt
、forecastsTimeTotal
- 与异常检测作业相关的预测的总运行时间(毫秒)。
-
forecasts.total
、ft
、forecastsTotal
- (默认)当前可用于作业的单个预测数。值为
1
或更大表示存在预测。 -
id
- (默认)异常检测作业的标识符。
-
model.bucket_allocation_failures
,mbaf
,modelBucketAllocationFailures
- 由于模型内存不足,无法处理传入数据中新实体的桶数。这种情况也由
hard_limit: memory_status
属性值表示。 -
model.by_fields
,mbf
,modelByFields
- 模型分析的
by
字段值的个数。此值是作业中所有检测器的累积值。 -
model.bytes
,mb
,modelBytes
- (默认) 模型使用的内存字节数。这是自上次模型持久化以来的最大值。如果作业已关闭,则此值表示最新大小。
-
model.bytes_exceeded
,mbe
,modelBytesExceeded
- 上次分配失败时内存使用量超过上限的字节数。
-
model.categorization_status
,mcs
,modelCategorizationStatus
-
作业分类状态。包含以下值之一:
-
ok
:分类性能良好(或根本未使用)。 -
warn
:分类检测到类别分布表明输入数据不适合分类。问题可能是只有一个类别,超过90%的类别很少见,类别数量大于已分类文档数量的50%,没有频繁匹配的类别,或者超过50%的类别已失效。
-
-
model.categorized_doc_count
,mcdc
,modelCategorizedDocCount
- 已分类字段的文档数量。
-
model.dead_category_count
,mdcc
,modelDeadCategoryCount
- 由分类创建但永远不会再次分配的类别数量,因为另一个类别的定义使其成为失效类别的超集。(失效类别是分类没有预先训练的方式的副作用。)
-
model.failed_category_count
,mdcc
,modelFailedCategoryCount
- 分类想要创建新类别但由于作业已达到
model_memory_limit
而无法创建的次数。此计数不跟踪哪些特定类别未能创建。因此,您无法使用此值来确定错过的唯一类别的数量。 -
model.frequent_category_count
,mfcc
,modelFrequentCategoryCount
- 匹配超过1%已分类文档的类别数量。
-
model.log_time
,mlt
,modelLogTime
- 根据服务器时间收集模型统计信息的时间戳。
-
model.memory_limit
,mml
,modelMemoryLimit
- 模型内存使用上限,在增加值时检查。
-
model.memory_status
,mms
,modelMemoryStatus
-
(默认) 数学模型的状态,可以具有以下值之一:
-
ok
:模型保持在配置值以下。 -
soft_limit
:模型使用了超过配置内存限制的60%,将修剪较旧的未使用模型以释放空间。此外,在分类作业中,将不再存储其他类别示例。 -
hard_limit
:模型使用的空间超过配置的内存限制。结果,并非所有传入数据都已处理。
-
-
model.output_memory_allocator_bytes
,momab
,modelOutputMemoryAllocatorBytes
- 用于输出异常检测作业文档的内存量(以字节为单位)。
-
model.over_fields
,mof
,modelOverFields
- 模型分析的
over
字段值的个数。此值是作业中所有检测器的累积值。 -
model.partition_fields
,mpf
,modelPartitionFields
- 模型分析的
partition
字段值的个数。此值是作业中所有检测器的累积值。 -
model.rare_category_count
,mrcc
,modelRareCategoryCount
- 只匹配一个已分类文档的类别数量。
-
model.timestamp
,mt
,modelTimestamp
- 收集模型统计信息的最后一条记录的时间戳。
-
model.total_category_count
,mtcc
,modelTotalCategoryCount
- 由分类创建的类别数量。
-
node.address
,na
,nodeAddress
-
节点的网络地址。
包含运行作业的节点的属性。此信息仅适用于打开的作业。
-
node.ephemeral_id
,ne
,nodeEphemeralId
-
节点的临时ID。
包含运行作业的节点的属性。此信息仅适用于打开的作业。
-
node.id
,ni
,nodeId
-
节点的唯一标识符。
包含运行作业的节点的属性。此信息仅适用于打开的作业。
-
node.name
,nn
,nodeName
-
节点名称。
包含运行作业的节点的属性。此信息仅适用于打开的作业。
-
opened_time
,ot
- 仅对于打开的作业,作业已打开的经过时间。
-
state
,s
-
(默认) 异常检测作业的状态,可以是以下值之一:
-
closed
:作业已成功完成,其模型状态已持久化。作业必须先打开才能接受更多数据。 -
closing
:作业关闭操作正在进行中,尚未完成。关闭的作业无法接受更多数据。 -
failed
:由于错误,作业未成功完成。这种情况可能是由于无效的输入数据、分析过程中发生的致命错误或外部交互(例如 Linux 内存不足 (OOM) 终止程序)造成的。如果作业已不可挽回地失败,则必须强制关闭并删除它。如果可以更正数据馈送,则可以关闭作业,然后重新打开它。 -
opened
:作业可接收和处理数据。 -
opening
:作业打开操作正在进行中,尚未完成。
-
-
-
帮助
- (可选,布尔值) 如果
true
,则响应包含帮助信息。默认为false
。 -
s
- (可选,字符串) 用于对响应进行排序的列名或列别名的逗号分隔列表。
-
时间
- (可选,时间单位) 用于显示时间值的单位。
-
v
- (可选,布尔值) 如果
true
,则响应包含列标题。默认为false
。
示例
编辑resp = client.cat.ml_jobs( h="id,s,dpr,mb", v=True, ) print(resp)
response = client.cat.ml_jobs( h: 'id,s,dpr,mb', v: true ) puts response
const response = await client.cat.mlJobs({ h: "id,s,dpr,mb", v: "true", }); console.log(response);
GET _cat/ml/anomaly_detectors?h=id,s,dpr,mb&v=true
id s dpr mb high_sum_total_sales closed 14022 1.5mb low_request_rate closed 1216 40.5kb response_code_rates closed 28146 132.7kb url_scanning closed 28146 501.6kb