什么是无服务器监控?

无服务器监控定义

无服务器监控是一项服务,允许企业监控、开发和优化其无服务器应用程序。无服务器监控的事件驱动架构 (EDA) 需要专门为该环境设计的监控。无服务器监控使用已知指标来将团队指向问题。

无服务器监控是整体可观测性的重要组成部分。无服务器可观测性可以更好地了解系统输出,以便相关团队可以更有效地解决和补救潜在问题。

企业可以使用无服务器监控来评估其系统的运行状况、配置警报以解决出现的问题,并进而优化性能。无服务器监控也是一个重要的成本管理工具,可以优化性能。

什么是无服务器?

无服务器计算是一种云计算模型,允许开发人员构建和运行应用程序,而无需管理服务器或后端基础设施。云提供商为开发人员运行和管理服务器基础设施,并按需且大规模地提供服务器。从成本角度来看,这种计算模型的基于消耗的定价对企业非常有利。无服务器的按需付费结构使企业能够以较低的基础设施成本部署和扩展应用程序。

所有领先的云提供商都以函数即服务 (FaaS) 的形式提供无服务器计算。

  • AWS Lambda 是 AWS 的无服务器函数。它允许开发人员在无需考虑服务器或集群的情况下运行代码。
  • Google Cloud Functions 使您能够开发和部署可扩展的应用程序和函数,同时它们管理您的基于云的服务器。
  • Azure Serverless FaaS 使您能够构建、部署和操作应用程序,而无需管理基础设施。

还有一些公司使用 OpenLambda、OpenFaas 等在自己的基础设施上使用的无服务器框架。

但是,在无服务器服务中观察系统和应用程序操作方面存在挑战。无服务器监控通过使您能够监控运行的函数、它们所在的容器、应用程序以及整个无服务器环境,来填补可见性空白。

了解有关 APM 的更多信息

无服务器监控如何工作?

无服务器监控解决方案从您的整个无服务器基础设施中提取数据,汇总资源使用统计数据,并提供日志和指标。无服务器监控还允许您查看无服务器函数活动、监控资源使用情况并设置自动警报以获得可操作的见解。

借助无服务器监控仪表板,您可以通过监控函数运行状况和内存使用情况来消除盲点,并确定应用程序瓶颈发生的位置。

为什么无服务器监控很重要?

无服务器监控允许开发人员解决对无服务器计算中的系统运行状况和用户体验至关重要的性能问题。

使用无服务器,云提供商承担了管理服务器的负担,以便您的开发人员可以专注于运行代码。虽然这有很多优点,但这意味着企业对其环境的控制权和可见性较差。因此,识别错误或问题可能会很困难。

无服务器监控通过允许团队有效地识别和管理复杂数字生态系统中经常出现的问题,为这些挑战提供了解决方案。

无服务器监控也是一个至关重要的工具,使 ITDM 和 BDM 能够监控无服务器支出。了解给定时间正在使用的资源数量的能力使企业能够根据需要扩大或缩小规模并控制支出。

无服务器监控有哪些好处?

无服务器监控可以提高效率,并让您了解无服务器环境的可见性。您可以主动缓解和解决性能问题,并简化各种操作。

Serverless monitoring dashboards segment and analyze serverless metadata joined with observability data.

  1. 改善延迟
    函数执行缓慢(即延迟)会对用户体验产生负面影响。大型数据集会影响您精确定位延迟问题的能力。在大型数据集提取中,隐藏在平均指标背后的异常数据通常很难被发现,而这些异常数据恰恰能揭示延迟问题。监控工具可以为您提供可自定义的仪表板,以应对这些挑战。
  2. 防止冷启动
    无服务器计算的事件驱动架构意味着它仅在事件需要时才使用容器来执行函数。无服务器计算应用程序可以将最近使用的函数“保持温热”一段时间,但如果一段时间没有调用,它就会进入“冷”状态。当一个处于冷状态一段时间的函数突然被再次调用时,就会发生冷启动。这可能会导致延迟问题,并需要额外的计算能力。无服务器监控工具可以帮助识别哪些函数在何时被使用,以便您可以优化性能。
  3. 识别调用错误

    调用错误是对链中任何断开的链接的响应。当在您的函数收到调用请求之前,该请求被拒绝时,就会发生调用错误。

    通过监控解决方案,您可以了解无服务器环境的可见性,从而识别和解决调用错误。

  4. 监控使用情况
    内存使用是无服务器计算服务的一个可配置组件。根据提供商的不同,您可以设置分配给一个函数的内存空间大小。此决定会影响调用该函数时运行该函数所需的处理能力。
  5. 预测成本
    无服务器提供商仅对使用的函数和计算资源收费。通常,这是一种比其他架构更具成本效益的替代方案,因为您只需为您使用的资源付费。但是,当您扩展操作时,成本增加可能变得难以预测。例如,配置错误的函数可能会消耗比必要更多的计算资源。通过总体拥有成本(TCO)无服务器模型,您可以更好地预测成本,因为基础设施、开发和维护成本已经考虑在内。
  6. 更好的可扩展性
    借助无服务器监控解决方案,您可以监控函数和使用情况,并更好地预测成本,从而更好地进行扩展。通过监控使用情况和预测成本,企业可以更有效地扩展,同时保持在预算范围内。

无服务器监控的最佳实践是什么?

细粒度信息:一个好的无服务器监控工具应该为您提供特定数据,包括请求日志和分布式跟踪。寻找一个可以提供完整画面并允许您深入查看问题点的监控解决方案。

Serverless monitoring tools provide visibility into serverless calls, latency issues, cold starts along, and errors.

数据可用性:监控数据应立即可用。您需要寻找适合您的规模并可以随着您扩展的监控工具。

日志收集:日志收集不应导致延迟或干扰应用程序性能。寻找一个与您的系统兼容,不需要任何附加组件和插件的监控工具。

使用 Elastic 探索无服务器监控

Elastic serverless forwarder architecture

警报:寻找一个允许您配置与现有检测和警报机制匹配的警报的无服务器监控工具。跨系统的统一策略有助于节省时间和相关成本。

Serverless monitoring to leverage threshold or anomaly-based alerting

无服务器监控有哪些挑战?

无服务器监控的第一个挑战是透明度。在无服务器计算模型中,服务器由您的云提供商管理,例如 AWS。虽然无服务器意味着您可以专注于开发和启动代码,而无需担心服务器的可用性,但您的服务器可见性较低。这就需要专门针对您的无服务器环境的监控服务,以便您可以获得整体可观测性。

无服务器监控的其他挑战包括

  • 无状态性质:无服务器模型仅在调用函数时才使用容器。只有当系统调用函数时,服务器才是可访问的。
  • 瞬态函数:无服务器架构基于触发函数的事件构建,因此很难监控。根据云提供商的运行时限制,监控变得更加复杂。
  • 分布式架构:无服务器应用程序本质上是分布式的,它们的组件可以分布在包括服务器和无服务器架构在内的多个服务中。这使得难以获得应用程序的健康状况和性能的完整图景。
  • 快速扩展:无服务器应用程序可以根据需求快速向上或向下扩展,这使得难以预测和管理监控这些无服务器应用程序所需的资源。
  • 成本优化:监控无服务器应用程序可能很昂贵,尤其是在使用基于使用量收费的第三方监控工具时。

为了应对这些挑战,企业应拥有一个全面的可观测性解决方案,该解决方案可以处理服务器和无服务器监控。全面的可观测性解决方案有助于弥合监控类型之间的差距,以便您可以体验无服务器架构的所有好处。

无服务器监控工具

无服务器监控工具对于在无服务器环境中运行至关重要。在最佳情况下,它们应提供无缝体验,从而提高您的整体运营效率。但并非所有工具都是一样的。

像 AWS 这样的无服务器函数提供商提供本地监控工具。AWS Cloud Watch 和 AWS X-Ray 是满足不同功能的无服务器监控解决方案。如果仅使用 AWS,它们可以结合使用,为您提供更好的无服务器可见性。如果您的操作依赖于多个云提供商,则需要一个与这些提供商集成的无服务器监控工具。

在为您的企业选择合适的无服务器监控工具时,以下是一些需要考虑的事项

  • 统一可见性:使用单个工具获得完整堆栈视图的能力可以改善您的故障排除工作流程。考虑为这些功能使用一个单一的管理平台,而不是多个 UI 和工具,这些 UI 和工具会使故障排除工作流程复杂化。
  • 实时跟踪:实时警报和指标数据可以实现完全可见性。立即通知您的团队任何潜在的危险信号。
  • 语言支持:确保您的无服务器监控工具支持您所有的编程语言。
  • 易于设置:无服务器监控应该使您的系统更简单,而不是更复杂。寻找易于使用和实施的解决方案。
  • 集成:您的无服务器监控工具还应与 AWS、Azure 和 Google Cloud 等其他云集成兼容。选择一个可以无缝支持您整个运行环境的工具。

无服务器摄取

无服务器摄取是一种无需代理的方式,可以从 AWS 环境中的多个来源提取大型数据集。借助 Elastic Serverless Forwarder(一个由 Elasticsearch 提供支持的内置数据摄取工具),您可以无摩擦地提取、转换、丰富数据,并将其发送到您的无服务器监控工具或可观测性工具。

Architecture for extracting, transforming, enriching, and sending data to serverless monitoring tools.

使用 Elastic 探索无服务器摄取工具

使用 Elastic 进行无服务器监控

Elastic Observability 构建在 Elasticsearch 之上,提供完整的堆栈体验,让您能够监控和观察无服务器架构之外的环境,包括本地和云环境。识别 AWS Lambda 延迟问题、冷启动和其他调用问题。日志与您的其他遥测数据一起收集,因此您可以在一个地方、在上下文中查看所有数据。

了解有关 Elastic 无服务器监控解决方案的更多信息