正在加载

检测指标异常

Elastic Stack Serverless

注意

对于 Observability 无服务器项目,需要 Editor 角色或更高级别的角色才能创建机器学习作业。要了解更多信息,请参阅分配用户角色和权限

您可以创建机器学习作业来检测和检查主机和 Kubernetes Pod 的内存使用情况和网络流量异常。

您可以对跨主机或 Pod 的系统内存使用情况以及入站和出站网络流量进行建模。您可以检测到内存使用量的异常增加以及跨主机或 Pod 的异常高的入站或出站流量。

创建一个机器学习作业来自动检测异常的内存使用情况和网络流量。

创建机器学习作业后,您无法更改设置。您可以稍后重新创建这些作业。但是,您将删除任何先前检测到的异常。

  1. 要打开 基础设施清单,请在主菜单中找到 基础设施,或使用全局搜索字段

  2. 单击页面顶部的 异常检测 链接。

  3. 系统将提示您为 主机Kubernetes Pod 创建一个机器学习作业。单击 启用

  4. 选择机器学习分析的开始日期。

    机器学习作业分析最近四周的数据,并无限期地继续运行。

  5. 选择一个分区字段。

    注意

    默认情况下,选择 Kubernetes 分区字段 kubernetes.namespace

    分区允许您为共享类似行为的不同数据组创建独立的模型。例如,您可能希望为机器类型或云可用区构建单独的模型,以便在各组之间不以相同的方式对异常进行加权。

  6. 默认情况下,机器学习作业会分析您的所有指标数据,结果会列在 异常 选项卡下。您可以过滤此列表以仅查看您感兴趣的作业或指标。例如,您可以按作业名称和节点名称进行过滤,以查看该主机的特定异常检测作业。

  7. 单击 启用作业

  8. 您现在可以探索您的指标异常了。单击 异常

  1. 在您的 Elastic Observability Serverless 项目中,转到 基础设施基础设施清单 并单击页面顶部的 异常检测 链接。
  2. 主机Kubernetes Pod 下,单击 启用 以创建一个机器学习作业。
  3. 选择机器学习分析的开始日期。机器学习作业分析最近四周的数据,并无限期地继续运行。
  4. 选择一个分区字段。分区允许您为共享类似行为的不同数据组创建独立的模型。例如,您可能希望为机器类型或云可用区构建单独的模型,以便在各组之间不以相同的方式对异常进行加权。
  5. 默认情况下,机器学习作业会分析您的所有指标数据。您可以过滤此列表以仅查看您感兴趣的作业或指标。例如,您可以按作业名称和节点名称进行过滤,以查看该主机的特定异常检测作业。
  6. 单击 启用作业
  7. 您现在可以探索您的指标异常了。单击 异常
Infrastructure {{ml-app}} anomalies

异常 表显示了特定主机或 Kubernetes Pod 的每个单一指标异常检测作业的列表。 默认情况下,异常作业按时间排序以显示最近的作业。

除了每个异常作业和节点名称之外,还会列出严重性评分等于或高于 50 的检测到的异常。这些评分代表所选时间段内的“警告”或更高级别的严重性。 摘要 值表示异常记录结果中指标的实际值与预期(“典型”)值之间的增加。

要向下钻取并分析指标异常,请选择 操作 → 在异常浏览器中打开 以查看异常浏览器。 您还可以选择 操作在清单中显示 以查看主机或 Kubernetes Pod 的清单页面,并按特定指标进行过滤。

注意

这些预定义的异常检测作业使用自定义规则。要更新异常浏览器中的规则,请选择 操作配置规则。更改仅对新结果生效。如果您想将更改应用于现有结果,请克隆并重新运行作业。

基础设施清单 页面上,单击 显示历史记录 以查看所选时间范围内的指标值。异常评分等于或高于 50 的检测到的异常以红色突出显示。要检查检测到的异常,请使用异常浏览器。

History
© . All rights reserved.