同义词 API

编辑

同义词管理 API 提供了一种方便的方式,可以在内部系统索引中定义和管理同义词。相关的同义词可以分组到一个“同义词集”中。根据需要创建任意数量的同义词集。

这提供了以下情况的替代方案:

  • 在分析器定义中定义内联同义词,这会影响映射大小并可能导致性能问题。
  • 使用同义词文件,这意味着需要在所有集群节点上上传和管理文件一致性。

同义词集可用于配置同义词图标记过滤器同义词标记过滤器。 这些过滤器作为分析过程的一部分,由搜索分析器应用。

同义词集每个集最多限制为 10,000 条同义词规则。如果需要管理更多的同义词规则,可以创建多个同义词集。

同义词集必须在添加到索引之前存在。如果创建的索引引用了不存在的同义词集,则该索引将保持在部分创建且无法操作的状态。从这种情况中恢复的唯一方法是确保同义词集存在,然后删除并重新创建索引,或者关闭并重新打开索引。

无效的同义词规则可能会在应用分析器更改时导致错误。对于可重新加载的分析器,这会阻止重新加载和应用更改。必须更正同义词规则中的错误并重新加载分析器。

具有无效同义词规则的索引无法重新打开,导致其在以下情况下无法操作:

  • 包含索引的节点启动
  • 索引从关闭状态打开
  • 发生节点重启(这将重新打开分配给节点的碎片)

同义词集 API

编辑

可以使用这些 API 动态更新搜索时使用的同义词集。搜索结果将立即反映同义词集更改。

使用以下 API 来管理同义词集

同义词规则 API

编辑

同义词集由同义词规则组成。每条同义词规则定义一组充当同义词的词。可以更新特定同义词集的各个同义词规则,而不是更新完整的同义词集。

使用以下 API 来管理同义词集中的各个同义词规则