服务概览
Elastic Stack Serverless
选择非移动端的 服务 将带您进入服务概览。服务概览包含各种图表和表格,可让您全面了解服务在整个基础架构中的性能
- 服务详细信息,例如服务版本、运行时版本、框架以及 APM 代理名称和版本
- 容器和编排信息
- 云提供商、机器类型、服务名称、区域和可用区
- 无服务器函数名称和事件触发器类型
- 随时间变化的延迟、吞吐量和错误
- 服务依赖项
为了深入了解服务的运行状况,您可以将服务的性能与先前的时间段或来自相应异常检测作业的预期范围进行比较。例如,延迟是否随着时间的推移而缓慢增加,服务是否经历了突然的峰值,吞吐量是否与机器学习作业的预期相似——启用比较可以提供答案。

选择比较框以应用基于时间的或预期范围的比较。 基于时间的比较选项基于选定的时间筛选器范围
时间筛选器 | 时间比较选项 |
---|---|
≤ 24 小时 | 一天或一周 |
> 24 小时且 ≤ 7 天 | 一周 |
> 7 天 | 与选定时间范围紧邻之前的相同时间量 |
预期范围比较由 机器学习 提供支持,并且需要启用异常检测。
服务的响应时间。您可以筛选延迟图表,以显示服务的平均、第 95 个百分位或第 99 个百分位延迟时间。

吞吐量图表可视化了选定服务的每分钟平均事务数。
事务表显示选定服务的事务组列表,包括延迟、流量、错误率和每个事务的影响。共享相同名称的事务被分组,并且每个组仅显示一个条目。
默认情况下,事务组按影响排序,以显示服务中使用最多和最慢的端点。如果您对某个特定端点感兴趣,请单击查看事务以在 事务概览 页面上查看类似事务的列表。
失败的事务率表示从选定服务的角度来看失败的事务的百分比。它对于可视化服务事务中意外的增加、减少或不规则模式非常有用。
从 HTTP 服务器角度来看,HTTP 事务不将 4xx
状态代码(客户端错误)视为失败,因为该失败是由调用者而不是 HTTP 服务器引起的。因此,event.outcome=success
并且失败的事务率不会增加。
但是,如果 HTTP 状态代码 ≥ 400,则从客户端角度来看,HTTP Span 被视为失败。这些 Span 将设置 event.outcome=failure
并提高失败的事务率。
如果没有 HTTP 状态,除非报告错误,否则事务和 Span 都被认为是成功的。
错误表提供了一个高级视图,显示每个错误消息首次和最后一次出现的时间,以及出现的总次数。这使得您可以非常轻松地快速查看哪些错误影响您的服务并采取措施纠正它们。为此,请单击查看错误。

按 Span 类型花费的时间图表可视化了每个 Span 类型的平均持续时间,并帮助您确定哪些 Span 可能会减慢事务的速度。图表下显示的“app”标签表示应用程序内部发生了某些事情。这可能表明 APM 代理没有针对该时间段内发生的任何事情进行自动检测,或者时间花费在应用程序代码中,而不是在数据库或外部请求中。
依赖项表显示与选定时间范围内的服务相关的下游服务或外部连接的列表。该表显示延迟、吞吐量、失败的事务率和每个依赖项的影响。默认情况下,依赖项按影响排序,以显示使用最多和最慢的依赖项。如果您对某个特定依赖项感兴趣,请单击查看依赖项以了解更多信息。
在 Elastic Stack 部署中,显示使用 Real User Monitoring (RUM) 代理检测的服务的依赖关系需要代理版本 ≥ v5.6.3。
冷启动率图表特定于无服务器服务,并显示触发无服务器函数冷启动的请求百分比。当无服务器函数在一段时间内未使用时,会发生冷启动。分析冷启动率对于决定为函数分配多少内存或何时删除大型依赖项非常有用。
冷启动率图表当前支持 AWS Lambda 函数和 Azure 函数。
实例表显示选定时间范围内所有可用服务实例的列表。根据服务的运行方式,该实例可以是主机或容器。该表显示每个实例的延迟、吞吐量、失败的事务、CPU 使用率和内存使用率。默认情况下,实例按吞吐量排序。

要查看与服务代理相关的元数据,以及(如果相关)容器和云提供商,请单击页面顶部服务名称旁边的每个图标。

服务信息
- 服务版本
- 运行时名称和版本
- 框架名称
- APM 代理名称和版本
容器信息
- 操作系统
- 容器化(是或否)
- 实例总数
- 编排
云提供商信息
- 云提供商
- 云服务名称
- 可用区
- 机器类型
- 项目 ID
- 区域
无服务器信息
- 函数名称
- 事件触发器类型
警报
- 最近触发的警报