服务概述
编辑服务概述编辑
选择一个非移动 服务 将带您进入 服务概述。 服务概述 包含各种图表和表格,提供有关服务在整个基础设施中的性能的高级可见性
- 服务详细信息,如服务版本、运行时版本、框架以及 APM 代理名称和版本
- 容器和编排信息
- 云提供商、机器类型、服务名称、区域和可用区
- 无服务器函数名称和事件触发类型
- 延迟、吞吐量和错误随时间的变化
- 服务依赖关系
时间序列和预期边界比较编辑
为了深入了解服务的运行状况,您可以比较服务相对于先前时间段或相对于相应异常检测作业的预期边界的性能。例如,延迟是否一直在缓慢增加,服务是否经历了突然的峰值,吞吐量是否与机器学习作业预期的一致 - 进行比较可以提供答案。
选择 比较 框以应用基于时间的或预期边界的比较。基于时间的比较选项基于所选时间过滤器范围
时间过滤器 | 时间比较选项 |
---|---|
≤ 24 小时 |
一天或一周 |
> 24 小时且 ≤ 7 天 |
一周 |
> 7 天 |
与所选时间范围紧邻的相同时间段 |
如果您的所选环境中存在机器学习作业,并且您有权 访问机器学习功能,则可以使用预期边界比较。
延迟编辑
服务的响应时间。您可以过滤 延迟 图表以显示服务的平均延迟时间、第 95 个百分位数或第 99 个百分位数延迟时间。
吞吐量和事务编辑
吞吐量 图表可视化所选服务的每分钟平均事务数。
事务 表显示所选服务的事务组列表,包括每个事务的延迟、流量、错误率和影响。共享相同名称的事务将被分组,并且每个组仅显示一个条目。
默认情况下,事务组按影响排序,以显示服务中最常用的和最慢的端点。如果您对某个特定端点感兴趣,请单击 查看事务 以在 事务概述 页面上查看类似事务的列表。
失败事务率和错误编辑
失败事务率表示从所选服务的角度来看失败事务的百分比。它对于可视化服务事务中意外的增加、减少或不规则模式很有用。
从 HTTP 服务器角度来看的 HTTP 事务 不会将 4xx
状态代码(客户端错误)视为失败,因为失败是由调用者而不是 HTTP 服务器引起的。因此,event.outcome=success
并且失败事务率不会增加。
但是,从客户端角度来看的 HTTP 跨度 如果 HTTP 状态代码 ≥ 400,则被视为失败。这些跨度将设置 event.outcome=failure
并增加失败事务率。
如果没有 HTTP 状态,则事务和跨度都被视为成功,除非报告了错误。
错误 表提供每个错误消息首次和最后出现时的概览,以及出现的总次数。这使得您可以非常轻松地快速查看哪些错误影响了您的服务并采取措施纠正它们。为此,请单击 查看错误。
跨度类型平均持续时间和依赖关系编辑
跨度类型花费的时间 图表可视化每个跨度类型的平均持续时间,并帮助您确定哪些跨度可能会减慢事务速度。图表下显示的“app”标签表示应用程序中发生了某些事情。这可能表明 APM 代理没有针对该时间段内发生的事情进行自动检测,或者时间是在应用程序代码中而不是在数据库或外部请求中花费的。
依赖关系 表显示与所选时间范围内的服务相关的下游服务或外部连接的列表。该表显示每个依赖关系的延迟、吞吐量、失败事务率和影响。默认情况下,依赖关系按影响排序,以显示使用最频繁和最慢的依赖关系。如果您对某个特定依赖关系感兴趣,请单击 查看依赖关系 以了解更多信息。
显示使用实时用户监控 (RUM) 代理检测的服务的依赖关系需要代理版本 ≥ v5.6.3。
冷启动率编辑
冷启动率图表特定于无服务器服务,并显示触发无服务器函数冷启动的请求百分比。冷启动发生在无服务器函数在一段时间内未使用时。分析冷启动率对于决定为函数分配多少内存或何时删除大型依赖关系很有用。
冷启动率图表目前支持 AWS Lambda 函数和 Azure 函数。
实例编辑
实例 表显示所选时间范围内的所有可用服务实例的列表。根据服务的运行方式,实例可以是主机或容器。该表显示每个实例的延迟、吞吐量、失败事务、CPU 使用率和内存使用率。默认情况下,实例按吞吐量排序。
服务元数据编辑
要查看与服务代理相关的元数据,以及如果相关,容器和云提供商,请单击位于页面顶部服务名称旁边的每个图标。
服务信息
- 服务版本
- 运行时名称和版本
- 框架名称
- APM 代理名称和版本
容器信息
- 操作系统
- 容器化 - 是或否。
- 实例总数
- 编排
云提供商信息
- 云提供商
- 云服务名称
- 可用区
- 机器类型
- 项目 ID
- 区域
无服务器信息
- 函数名称
- 事件触发类型
警报
- 最近触发的警报