监控自托管 Fleet Server

编辑

对于自托管 Fleet Server,监控至关重要,因为 Fleet Server 的运行状况直接关系到已部署 Agent 及其提供服务的健康状态。当 Fleet Server 运行不正常时,可能会导致其管理的 Agent 检查、状态信息和更新延迟。监控数据将告诉您何时为 Fleet Server 增加容量,并提供错误日志和信息来排查其他问题。

对于自托管集群,在创建新的 Agent策略或使用现有的默认 Fleet Server Agent 策略时,监控默认启用。

要监控 Fleet Server:

  1. 在 Fleet 中,打开Agent 策略选项卡。
  2. 单击 Fleet Server 策略名称以编辑策略。
  3. 单击设置选项卡,并验证是否已选择收集 Agent 日志收集 Agent 指标
  4. 接下来,将默认命名空间设置为类似于fleetserver的内容。

    设置默认命名空间可以将 Fleet Server 监控数据与其他收集的数据区分开来。这使得搜索和可视化监控数据更容易。

    Fleet Server agent policy
  5. 要确认您的更改,请单击保存更改

要查看为运行 Fleet Server 的 Agent 收集的指标,请转到分析 > 发现

在下面的示例中,fleetserver被配置为命名空间,您可以看到收集的指标。

Data stream

转到分析 > 仪表盘并搜索名为[Elastic Agent] Agent 指标的预定义仪表盘。选择此仪表盘,并根据fleetserver命名空间运行查询。

以下仪表盘显示了查询data_stream.namespace: "fleetserver"的数据。在此示例中,您可以观察 CPU 和内存使用情况作为指标,然后根据需要调整 Fleet Server 的大小。

Dashboard Data stream

请注意,作为运行查询的替代方法,您可以在仪表盘中隐藏除fleet_server之外的所有指标。