正在加载

查找事务延迟和失败相关性

Elastic Stack Serverless

相关性会显示您的数据的属性,这些属性可能与高延迟或错误的事务相关。 例如,如果您是负责保持生产系统正常运行的站点可靠性工程师,您会希望了解导致事务速度变慢的原因。 识别导致较高延迟事务的属性可能会将您指向根本原因。 您可能会发现与特定硬件(如主机或 Pod)的相关性。 或者,基于 IP 地址或区域,一组用户可能由于本地数据中心问题而面临更高的延迟。

要查找相关性

在应用程序 UI 的 Services(服务)页面上选择一项服务,然后从 Transactions(事务)选项卡中选择一个事务组。

  1. 在您的 Elastic Observability Serverless 项目中,转至 Applications(应用程序)Service Inventory(服务清单)
  2. 选择一项服务。
  3. 选择 Transactions(事务)选项卡。
  4. Transactions(事务)表中选择一个事务组。
注意

活动查询应用于相关性。

Latency correlations(延迟相关性)选项卡上的相关性可帮助您发现哪些属性会导致事务延迟增加。

APM latency correlations

进度条指示异步分析的状态,该分析在大量属性中执行统计搜索。 对于较大的时间范围和具有高事务吞吐量的服务,这可能需要一些时间。 要提高性能,请缩短时间范围。

延迟分布图可视化事务组中事务的总体延迟。 如果存在与慢响应时间具有统计意义的相关性的属性,它们将列在图表下方的表格中。 该表按 0 到 1 的相关系数排序。 具有较高相关值的属性更可能导致高延迟事务。 默认情况下,相关值最高的属性会添加到图表中。 要查看其他属性的延迟分布,请选择表格中的相应行。

如果相关属性看起来值得注意,请使用 Filter(筛选)快速链接

  • + 在应用程序 UI 中创建一个新查询,用于筛选包含所选值的事务。
  • - 在应用程序 UI 中创建一个新查询,用于筛选掉包含所选值的事务。

您还可以单击字段名称旁边的图标以查看和筛选其最常用的值。

在此示例屏幕截图中,事务向右倾斜,响应时间比总体延迟分布慢。 如果您在表格的相应行中选择 + 筛选器,它会在应用程序 UI 中创建一个新查询,用于包含此属性的事务。 过滤掉“噪声”后,您可以开始查看样本跟踪以继续您的调查。

Failed transaction correlations(失败事务相关性)选项卡上的相关性可帮助您发现哪些属性对区分事务失败和成功最有影响力。 在这种情况下,事务的成功或失败由其 event.outcome 值确定。 例如,当 HTTP 事务返回 5xx 状态代码时,APM 代理会将 event.outcome 设置为 failure

该图表突出显示事务组的总体延迟分布中的失败事务。 如果存在与失败事务具有统计意义的相关性的属性,它们将列在一个表格中。 该表按分数排序,这些分数映射到高、中或低影响级别。 具有高影响级别的属性更可能导致失败事务。 默认情况下,得分最高的属性会添加到图表中。 要在图表中查看不同的属性,请选择表格中的相应行。

例如,在下面的屏幕截图中,存在诸如特定节点和 Pod 名称之类的属性,这些属性对失败事务具有中等影响。

Failed transaction correlations

选择 + 筛选器以在应用程序 UI 中创建一个新查询,用于包含一个或多个这些属性的事务。 如果您不熟悉某个字段,请单击其名称旁边的图标以查看其最常用的值,并可以选择对这些值进行筛选。 每次添加另一个属性时,它都会过滤掉越来越多的噪声,并使您更接近诊断。

© . All rights reserved.