限制
编辑限制
编辑以下限制和已知问题适用于 Elastic 自然语言处理训练模型功能的 8.17.0 版本。
使用 semantic_text
字段时的文档大小限制
编辑当使用语义文本摄取文档时,会自动进行分块。块的数量受 index.mapping.nested_objects.limit
集群设置限制,该设置默认为 10k。过大的文档会在摄取期间导致错误。为避免此问题,请在摄取之前将文档拆分为大约 1MB 的部分。
ELSER 语义搜索限制为每个应用推理的字段 512 个标记
编辑当您使用 ELSER 进行语义搜索时,仅考虑从摄取的文档的每个字段中提取的前 512 个标记,这些文档将应用 ELSER 进行搜索过程。如果您的数据集包含长文档,如果您需要搜索全文,请在摄取之前将它们分成较小的片段。