数据集质量
编辑数据集质量
编辑[beta] 此功能为 Beta 版,可能会发生更改。其设计和代码不如正式 GA 功能成熟,并按原样提供,不提供任何保证。Beta 版功能不受正式 GA 功能的支持 SLA 约束。
数据集质量页面提供了日志、指标、追踪和合成数据集的概述。使用此信息来了解您的整体数据集质量,并查找包含解析不正确文档的数据集。
要打开数据集质量,请在主菜单中找到堆栈管理或使用全局搜索字段。默认情况下,该页面仅显示日志数据集。要查看其他数据集类型,请从类型菜单中选择它们。
要求
具有 viewer
角色的用户可以查看数据集质量摘要。要查看活动数据集和估计数据摘要,用户需要对 logs-*-*
索引具有 monitor
索引权限。
您的数据集的质量基于每个数据集中降级文档的百分比。数据集中降级的文档包含 _ignored 属性,因为在索引期间忽略了其一个或多个字段。忽略字段的原因有很多。例如,当 ignore_malformed 参数设置为 true 时,如果文档字段包含错误的数据类型,则会忽略格式错误的字段,并索引文档的其余部分。
从数据集表格中,您将找到每个数据集的信息,例如其命名空间、大小、数据集上次活动的时间以及降级文档的百分比。降级文档的百分比根据以下比例确定数据集的质量
- 良好 (): 数据集中 0% 的文档已降级。
- 降级 (): 数据集中大于 0% 且高达 3% 的文档已降级。
- 差 (): 数据集中大于 3% 的文档已降级。
打开特定数据集的详细信息会显示降级文档的历史记录、数据集的摘要以及其他可以帮助您确定是否需要调查任何问题的详细信息。
调查问题
编辑数据集质量页面有几种不同的方法可以帮助您查找忽略的字段并调查问题。从数据集表格中,您可以打开数据集的详细信息页面,并查看通常忽略的字段以及有关这些字段的信息。在 Logs Explorer 中打开日志数据集,或在 Discover 中打开其他数据集类型,以查找单个文档中忽略的字段。
查找数据集中忽略的字段
编辑要打开质量较差或已降级的数据集的详细信息页面并查看忽略的字段
- 从数据集表格中,单击质量较差或已降级的数据集旁边的 。
- 从详细信息页面,向下滚动到 质量问题。
质量问题部分显示了在摄取期间被忽略的字段、包含忽略字段的文档数量以及字段最后一次被忽略的时间戳。
查找单个文档中忽略的字段
编辑要使用 Logs Explorer 或 Discover 查找单个文档中忽略的字段
- 使用数据集表格的 降级文档 列查找包含降级文档的数据集。
- 单击 降级文档 列中的百分比,以在 Logs Explorer 或 Discover 中打开数据集。
Logs Explorer 或 Discover 中的文档表会自动过滤以显示未正确解析的文档。在操作列下,您将找到降级文档图标。
现在您知道哪些文档包含忽略的字段,请更仔细地检查它们以查找问题的根源
- 在操作列下,单击 以打开文档详细信息。
- 选择 JSON 选项卡。
- 滚动到 JSON 的末尾以查找
ignored_field_values
。
在这里,您将找到文档中所有 _ignored
字段及其值,这应该提供一些关于字段被忽略原因的线索。