机器学习集成

编辑

机器学习集成启动一个新的预定义作业,用于计算 APM 事务持续时间的异常分数。通过此集成,您可以快速查明异常事务并查看任何上游和下游服务的运行状况。

机器学习作业是按环境创建的,并基于服务的平均响应时间。由于作业是在环境级别创建的,因此您可以将新服务添加到现有环境中,而无需额外的机器学习作业。

机器学习作业的结果显示在应用程序用户界面的多个位置

  • 服务概览 提供所有服务总体运行状况的快速浏览视图。

    Example view of anomaly scores on response times in the Applications UI
  • 事务持续时间图表将显示预期边界,并在异常分数达到 75 或以上时添加注释。

    Example view of anomaly scores on response times in the Applications UI
  • 服务地图将根据检测到的异常分数显示颜色编码的异常指示器。

    Example view of anomaly scores on service maps in the Applications UI
启用异常检测
编辑

要启用机器学习异常检测

  1. 从服务概览、跟踪概览或服务地图选项卡中,选择 异常检测
  2. 单击 创建作业
  3. 机器学习作业是在环境级别创建的。选择要启用异常检测的所有服务环境。异常将针对所选环境中的所有服务和事务类型显示。
  4. 单击 创建作业

就这样!几分钟后,作业将开始计算结果;结果可能需要额外的时间才能显示在您的服务地图上。要管理现有作业,请单击 管理作业

异常检测警告
编辑

为了使机器学习的设置尽可能简单,当过滤到没有机器学习作业的环境时,应用程序用户界面会向您发出警告。

Example view of anomaly alert in the Applications UI
未知服务运行状况
编辑

启用异常检测后,服务运行状况可能会显示为“未知”。以下是一些可能发生这种情况的原因

  1. 不存在机器学习作业。请参阅 启用异常检测 以启用异常检测并创建机器学习作业。
  2. 该作业没有机器学习数据。如果您刚刚创建了机器学习作业,则需要等待几分钟才能获取数据。或者,如果服务或其环境是新的,则需要等待更多跟踪数据。
  3. 此服务不存在“request”或“page-load”事务类型;服务运行状况仅适用于这些事务类型。