机器学习集成

编辑

机器学习集成会启动一个预定义的新作业,用于计算 APM 事务持续时间的异常分数。通过此集成,您可以快速查明异常事务并查看任何上游和下游服务的运行状况。

机器学习作业是按环境创建的,基于服务的平均响应时间。由于作业是在环境级别创建的,因此您可以将新服务添加到现有环境中,而无需额外的机器学习作业。

机器学习作业的结果显示在应用程序 UI 的多个位置。

  • 服务概览中,可以快速查看所有服务的整体运行状况。

    Example view of anomaly scores on response times in the Applications UI
  • 事务持续时间图表将显示预期范围,并在异常分数达到 75 或以上时添加注释。

    Example view of anomaly scores on response times in the Applications UI
  • 服务地图将根据检测到的异常分数显示颜色编码的异常指示器。

    Example view of anomaly scores on service maps in the Applications UI
启用异常检测
编辑

要启用机器学习异常检测:

  1. 在服务概览、跟踪概览或服务地图选项卡中,选择异常检测
  2. 点击创建作业
  3. 机器学习作业是在环境级别创建的。选择要启用异常检测的所有服务环境。所选环境中的所有服务和事务类型都会显示异常。
  4. 点击创建作业

就是这样!几分钟后,作业将开始计算结果;结果可能需要更多时间才能出现在您的服务地图上。要管理现有作业,请点击管理作业

异常检测警告
编辑

为了使机器学习尽可能易于设置,当筛选到没有机器学习作业的环境时,应用程序 UI 会发出警告。

Example view of anomaly alert in the Applications UI
未知的服务运行状况
编辑

启用异常检测后,服务运行状况可能会显示为“未知”。以下是可能导致这种情况的一些原因:

  1. 不存在机器学习作业。请参阅启用异常检测以启用异常检测并创建机器学习作业。
  2. 作业没有机器学习数据。如果您刚刚创建了机器学习作业,则需要等待几分钟才能使用数据。或者,如果服务或其环境是新的,则需要等待更多跟踪数据。
  3. 此服务不存在“请求”或“页面加载”事务类型;服务运行状况仅适用于这些事务类型。