数据集质量

编辑

[测试版] 此功能处于测试阶段,可能会发生变化。其设计和代码不如正式 GA 功能成熟,按原样提供,不提供任何担保。测试版功能不受正式 GA 功能支持 SLA 的约束。

数据集质量页面提供了日志、指标、追踪和合成数据集的概述。使用此信息可以了解整体数据集质量,并查找包含解析错误的文档的数据集。

要打开数据集质量,请在主菜单中找到堆栈管理,或使用全局搜索字段。默认情况下,页面仅显示日志数据集。要查看其他数据集类型,请从类型菜单中选择它们。

Screen capture of the data set overview

要求

具有viewer角色的用户可以查看数据集质量摘要。要查看活动数据集和估计数据摘要,用户需要对logs-*-*索引具有monitor 索引权限

数据集的质量基于每个数据集中已降级文档的百分比。数据集中已降级的文档包含_ignored属性,因为其一个或多个字段在索引过程中被忽略。忽略字段的原因多种多样。例如,当ignore_malformed参数设置为true时,如果文档字段包含错误的数据类型,则会忽略格式错误的字段,并对文档的其余部分进行索引。

在数据集表格中,您可以找到每个数据集的信息,例如其命名空间、大小、数据集上次活动时间以及已降级文档的百分比。已降级文档的百分比根据以下比例确定数据集的质量

  • 良好(良好图标):数据集中的文档均未降级。
  • 已降级(已降级图标):数据集中的文档降级比例大于 0% 并最多达到 3%。
  • 较差(较差图标):数据集中的文档降级比例大于 3%。

打开特定数据集的详细信息会显示已降级文档的历史记录、数据集摘要以及其他详细信息,这些详细信息可以帮助您确定是否需要调查任何问题。

调查问题

编辑

数据集质量页面提供了几种不同的方法来帮助您查找被忽略的字段并调查问题。从数据集表格中,您可以打开数据集的详细信息页面,并查看常用被忽略字段以及有关这些字段的信息。在日志资源管理器中打开日志数据集,或在 Discover 中打开其他数据集类型,以查找各个文档中被忽略的字段。

查找数据集中被忽略的字段

编辑

要打开质量较差或已降级的数据集的详细信息页面并查看被忽略的字段

  1. 在数据集表格中,单击质量较差或已降级的数据集旁边的展开图标
  2. 在详细信息页面中,向下滚动到质量问题

质量问题部分显示了在摄取过程中被忽略的字段、包含被忽略字段的文档数量以及最后一次忽略该字段的时间戳。

在单个文档中查找被忽略的字段

编辑

要使用日志资源管理器或 Discover 在单个文档中查找被忽略的字段

  1. 使用数据集表格的已降级文档列查找包含已降级文档的数据集。
  2. 单击已降级文档列中的百分比以在日志资源管理器或 Discover 中打开数据集。

日志资源管理器或 Discover 中的文档表格会自动过滤以显示未正确解析的文档。在操作列下,您可以找到已降级文档图标。

现在您知道了哪些文档包含被忽略的字段,请仔细检查它们以查找问题的根源。

  1. 操作列下,单击展开图标以打开文档详细信息。
  2. 选择JSON选项卡。
  3. 滚动到 JSON 的末尾以查找ignored_field_values

在这里,您可以找到文档中所有_ignored字段及其值,这些值应该可以提供一些关于为什么忽略这些字段的线索。