服务概览
编辑服务概览
编辑选择一个非移动的 服务 将带您进入 服务概览。 服务概览 包含各种图表和表格,提供关于服务在整个基础设施中的性能的高级可视化。
- 服务详细信息,如服务版本、运行时版本、框架以及 APM 代理名称和版本
- 容器和编排信息
- 云提供商、机器类型、服务名称、区域和可用区
- 无服务器函数名称和事件触发类型
- 随时间推移的延迟、吞吐量和错误
- 服务依赖关系
为了深入了解服务的健康状况,您可以将服务的性能与之前的时间段或与相应异常检测作业的预期边界进行比较。例如,延迟是否一直在缓慢增加,服务是否经历了突然的峰值,吞吐量是否与机器学习作业的预期相似——启用比较可以提供答案。
选择 比较 框以应用基于时间或预期边界的比较。基于时间的比较选项基于所选时间筛选器范围。
时间筛选器 | 时间比较选项 |
---|---|
≤ 24 小时 |
一天或一周 |
> 24 小时且 ≤ 7 天 |
一周 |
> 7 天 |
在选定时间范围之前立即相同的时间段 |
如果您的选定环境中存在机器学习作业,并且您有权 访问机器学习功能,则可以使用预期边界比较。
服务的响应时间。您可以筛选 延迟 图表以显示服务的平均、第 95 百分位数或第 99 百分位数延迟时间。
吞吐量 图表可视化选定服务的每分钟平均事务数。
事务 表格显示选定服务的事务组列表,并包括每个事务的延迟、流量、错误率和影响。共享相同名称的事务将被分组,并且每个组仅显示一个条目。
默认情况下,事务组按影响排序,以显示服务中使用最多和最慢的端点。如果您对某个特定端点感兴趣,请单击 查看事务 以在 事务概览 页面上查看类似事务的列表。
事务失败率表示从选定服务的角度来看失败事务的百分比。它有助于可视化服务事务中意外的增加、减少或不规则模式。
从 HTTP 服务器的角度来看,HTTP 事务 不将 4xx
状态代码(客户端错误)视为失败,因为失败是由调用方而不是 HTTP 服务器引起的。因此,event.outcome=success
,并且事务失败率不会增加。
但是,从客户端的角度来看,HTTP 跨度 如果 HTTP 状态代码 ≥ 400,则会被视为失败。这些跨度将设置 event.outcome=failure
并增加事务失败率。
如果没有 HTTP 状态,则除非报告错误,否则事务和跨度都将被视为成功。
错误 表格提供每个错误消息首次和最后出现时间的高级视图,以及出现次数的总数。这使得您可以轻松快速地查看哪些错误影响了您的服务并采取措施纠正它们。为此,请单击 查看错误。
跨度类型花费的时间 图表可视化每个跨度类型的平均持续时间,并帮助您确定哪些跨度可能会减慢事务速度。“app”标签显示在图表下方,表示应用程序中发生了一些事情。这可能表明 APM 代理没有针对当时发生的事情进行自动检测,或者时间花在了应用程序代码中而不是数据库或外部请求中。
依赖关系 表格显示与选定时间范围内服务相关的下游服务或外部连接列表。该表格显示每个依赖关系的延迟、吞吐量、事务失败率和影响。默认情况下,依赖关系按影响排序,以显示使用最多和最慢的依赖关系。如果您对某个特定依赖关系感兴趣,请单击 查看依赖关系 以了解更多信息。
显示使用真实用户监控 (RUM) 代理检测的服务的依赖关系需要代理版本 ≥ v5.6.3。
冷启动率图表特定于无服务器服务,并显示触发无服务器函数冷启动的请求的百分比。当无服务器函数在一段时间内未使用时,就会发生冷启动。分析冷启动率对于确定为函数分配多少内存或何时删除大型依赖关系很有用。
冷启动率图表目前支持 AWS Lambda 函数和 Azure 函数。
实例 表格显示选定时间范围内所有可用服务实例的列表。根据服务的运行方式,实例可以是主机或容器。该表格显示每个实例的延迟、吞吐量、事务失败、CPU 使用率和内存使用率。默认情况下,实例按吞吐量排序。
要查看与服务代理相关的元数据,以及相关的容器和云提供商,请单击页面顶部服务名称旁边的每个图标。
服务信息
- 服务版本
- 运行时名称和版本
- 框架名称
- APM 代理名称和版本
容器信息
- 操作系统
- 容器化 - 是或否。
- 实例总数
- 编排
云提供商信息
- 云提供商
- 云服务名称
- 可用区
- 机器类型
- 项目 ID
- 区域
无服务器信息
- 函数名称
- 事件触发类型
警报
- 最近触发的警报