- Elasticsearch 指南其他版本
- 8.17 中的新功能
- Elasticsearch 基础
- 快速入门
- 设置 Elasticsearch
- 升级 Elasticsearch
- 索引模块
- 映射
- 文本分析
- 索引模板
- 数据流
- 摄取管道
- 别名
- 搜索您的数据
- 重新排名
- 查询 DSL
- 聚合
- 地理空间分析
- 连接器
- EQL
- ES|QL
- SQL
- 脚本
- 数据管理
- 自动缩放
- 监视集群
- 汇总或转换数据
- 设置高可用性集群
- 快照和还原
- 保护 Elastic Stack 的安全
- Watcher
- 命令行工具
- elasticsearch-certgen
- elasticsearch-certutil
- elasticsearch-create-enrollment-token
- elasticsearch-croneval
- elasticsearch-keystore
- elasticsearch-node
- elasticsearch-reconfigure-node
- elasticsearch-reset-password
- elasticsearch-saml-metadata
- elasticsearch-service-tokens
- elasticsearch-setup-passwords
- elasticsearch-shard
- elasticsearch-syskeygen
- elasticsearch-users
- 优化
- 故障排除
- 修复常见的集群问题
- 诊断未分配的分片
- 向系统中添加丢失的层
- 允许 Elasticsearch 在系统中分配数据
- 允许 Elasticsearch 分配索引
- 索引将索引分配过滤器与数据层节点角色混合,以在数据层之间移动
- 没有足够的节点来分配所有分片副本
- 单个节点上索引的分片总数已超过
- 每个节点的分片总数已达到
- 故障排除损坏
- 修复磁盘空间不足的数据节点
- 修复磁盘空间不足的主节点
- 修复磁盘空间不足的其他角色节点
- 启动索引生命周期管理
- 启动快照生命周期管理
- 从快照恢复
- 故障排除损坏的存储库
- 解决重复的快照策略失败问题
- 故障排除不稳定的集群
- 故障排除发现
- 故障排除监控
- 故障排除转换
- 故障排除 Watcher
- 故障排除搜索
- 故障排除分片容量健康问题
- 故障排除不平衡的集群
- 捕获诊断信息
- REST API
- API 约定
- 通用选项
- REST API 兼容性
- 自动缩放 API
- 行为分析 API
- 紧凑和对齐文本 (CAT) API
- 集群 API
- 跨集群复制 API
- 连接器 API
- 数据流 API
- 文档 API
- 丰富 API
- EQL API
- ES|QL API
- 功能 API
- Fleet API
- 图表探索 API
- 索引 API
- 别名是否存在
- 别名
- 分析
- 分析索引磁盘使用量
- 清除缓存
- 克隆索引
- 关闭索引
- 创建索引
- 创建或更新别名
- 创建或更新组件模板
- 创建或更新索引模板
- 创建或更新索引模板(旧版)
- 删除组件模板
- 删除悬挂索引
- 删除别名
- 删除索引
- 删除索引模板
- 删除索引模板(旧版)
- 存在
- 字段使用情况统计信息
- 刷新
- 强制合并
- 获取别名
- 获取组件模板
- 获取字段映射
- 获取索引
- 获取索引设置
- 获取索引模板
- 获取索引模板(旧版)
- 获取映射
- 导入悬挂索引
- 索引恢复
- 索引段
- 索引分片存储
- 索引统计信息
- 索引模板是否存在(旧版)
- 列出悬挂索引
- 打开索引
- 刷新
- 解析索引
- 解析集群
- 翻转
- 收缩索引
- 模拟索引
- 模拟模板
- 拆分索引
- 解冻索引
- 更新索引设置
- 更新映射
- 索引生命周期管理 API
- 推理 API
- 信息 API
- 摄取 API
- 许可 API
- Logstash API
- 机器学习 API
- 机器学习异常检测 API
- 机器学习数据帧分析 API
- 机器学习训练模型 API
- 迁移 API
- 节点生命周期 API
- 查询规则 API
- 重新加载搜索分析器 API
- 存储库计量 API
- 汇总 API
- 根 API
- 脚本 API
- 搜索 API
- 搜索应用程序 API
- 可搜索快照 API
- 安全 API
- 身份验证
- 更改密码
- 清除缓存
- 清除角色缓存
- 清除权限缓存
- 清除 API 密钥缓存
- 清除服务帐户令牌缓存
- 创建 API 密钥
- 创建或更新应用程序权限
- 创建或更新角色映射
- 创建或更新角色
- 批量创建或更新角色 API
- 批量删除角色 API
- 创建或更新用户
- 创建服务帐户令牌
- 委托 PKI 身份验证
- 删除应用程序权限
- 删除角色映射
- 删除角色
- 删除服务帐户令牌
- 删除用户
- 禁用用户
- 启用用户
- 注册 Kibana
- 注册节点
- 获取 API 密钥信息
- 获取应用程序权限
- 获取内置权限
- 获取角色映射
- 获取角色
- 查询角色
- 获取服务帐户
- 获取服务帐户凭据
- 获取安全设置
- 获取令牌
- 获取用户权限
- 获取用户
- 授予 API 密钥
- 具有权限
- 使 API 密钥失效
- 使令牌失效
- OpenID Connect 准备身份验证
- OpenID Connect 身份验证
- OpenID Connect 注销
- 查询 API 密钥信息
- 查询用户
- 更新 API 密钥
- 更新安全设置
- 批量更新 API 密钥
- SAML 准备身份验证
- SAML 身份验证
- SAML 注销
- SAML 失效
- SAML 完成注销
- SAML 服务提供商元数据
- SSL 证书
- 激活用户配置文件
- 禁用用户配置文件
- 启用用户配置文件
- 获取用户配置文件
- 建议用户配置文件
- 更新用户配置文件数据
- 具有用户配置文件权限
- 创建跨集群 API 密钥
- 更新跨集群 API 密钥
- 快照和还原 API
- 快照生命周期管理 API
- SQL API
- 同义词 API
- 文本结构 API
- 转换 API
- 使用情况 API
- Watcher API
- 定义
- 迁移指南
- 发行说明
- Elasticsearch 版本 8.17.0
- Elasticsearch 版本 8.16.1
- Elasticsearch 版本 8.16.0
- Elasticsearch 版本 8.15.5
- Elasticsearch 版本 8.15.4
- Elasticsearch 版本 8.15.3
- Elasticsearch 版本 8.15.2
- Elasticsearch 版本 8.15.1
- Elasticsearch 版本 8.15.0
- Elasticsearch 版本 8.14.3
- Elasticsearch 版本 8.14.2
- Elasticsearch 版本 8.14.1
- Elasticsearch 版本 8.14.0
- Elasticsearch 版本 8.13.4
- Elasticsearch 版本 8.13.3
- Elasticsearch 版本 8.13.2
- Elasticsearch 版本 8.13.1
- Elasticsearch 版本 8.13.0
- Elasticsearch 版本 8.12.2
- Elasticsearch 版本 8.12.1
- Elasticsearch 版本 8.12.0
- Elasticsearch 版本 8.11.4
- Elasticsearch 版本 8.11.3
- Elasticsearch 版本 8.11.2
- Elasticsearch 版本 8.11.1
- Elasticsearch 版本 8.11.0
- Elasticsearch 版本 8.10.4
- Elasticsearch 版本 8.10.3
- Elasticsearch 版本 8.10.2
- Elasticsearch 版本 8.10.1
- Elasticsearch 版本 8.10.0
- Elasticsearch 版本 8.9.2
- Elasticsearch 版本 8.9.1
- Elasticsearch 版本 8.9.0
- Elasticsearch 版本 8.8.2
- Elasticsearch 版本 8.8.1
- Elasticsearch 版本 8.8.0
- Elasticsearch 版本 8.7.1
- Elasticsearch 版本 8.7.0
- Elasticsearch 版本 8.6.2
- Elasticsearch 版本 8.6.1
- Elasticsearch 版本 8.6.0
- Elasticsearch 版本 8.5.3
- Elasticsearch 版本 8.5.2
- Elasticsearch 版本 8.5.1
- Elasticsearch 版本 8.5.0
- Elasticsearch 版本 8.4.3
- Elasticsearch 版本 8.4.2
- Elasticsearch 版本 8.4.1
- Elasticsearch 版本 8.4.0
- Elasticsearch 版本 8.3.3
- Elasticsearch 版本 8.3.2
- Elasticsearch 版本 8.3.1
- Elasticsearch 版本 8.3.0
- Elasticsearch 版本 8.2.3
- Elasticsearch 版本 8.2.2
- Elasticsearch 版本 8.2.1
- Elasticsearch 版本 8.2.0
- Elasticsearch 版本 8.1.3
- Elasticsearch 版本 8.1.2
- Elasticsearch 版本 8.1.1
- Elasticsearch 版本 8.1.0
- Elasticsearch 版本 8.0.1
- Elasticsearch 版本 8.0.0
- Elasticsearch 版本 8.0.0-rc2
- Elasticsearch 版本 8.0.0-rc1
- Elasticsearch 版本 8.0.0-beta1
- Elasticsearch 版本 8.0.0-alpha2
- Elasticsearch 版本 8.0.0-alpha1
- 依赖项和版本
间隔查询
编辑间隔查询
编辑根据匹配项的顺序和邻近度返回文档。
intervals
查询使用匹配规则,这些规则由一小组定义构成。然后,将这些规则应用于指定的 field
中的词项。
这些定义产生跨越文本主体中词项的最小间隔序列。这些间隔可以通过父源进一步组合和过滤。
示例请求
编辑以下 intervals
搜索返回包含 my favorite food
且没有任何间隔的文档,后跟 hot water
或 cold porridge
,这些词项位于 my_text
字段中。
此搜索将匹配 my_text
值为 my favorite food is cold porridge
的文档,但不匹配 when it's cold my favorite food is porridge
的文档。
resp = client.search( query={ "intervals": { "my_text": { "all_of": { "ordered": True, "intervals": [ { "match": { "query": "my favorite food", "max_gaps": 0, "ordered": True } }, { "any_of": { "intervals": [ { "match": { "query": "hot water" } }, { "match": { "query": "cold porridge" } } ] } } ] } } } }, ) print(resp)
response = client.search( body: { query: { intervals: { my_text: { all_of: { ordered: true, intervals: [ { match: { query: 'my favorite food', max_gaps: 0, ordered: true } }, { any_of: { intervals: [ { match: { query: 'hot water' } }, { match: { query: 'cold porridge' } } ] } } ] } } } } } ) puts response
const response = await client.search({ query: { intervals: { my_text: { all_of: { ordered: true, intervals: [ { match: { query: "my favorite food", max_gaps: 0, ordered: true, }, }, { any_of: { intervals: [ { match: { query: "hot water", }, }, { match: { query: "cold porridge", }, }, ], }, }, ], }, }, }, }, }); console.log(response);
POST _search { "query": { "intervals" : { "my_text" : { "all_of" : { "ordered" : true, "intervals" : [ { "match" : { "query" : "my favorite food", "max_gaps" : 0, "ordered" : true } }, { "any_of" : { "intervals" : [ { "match" : { "query" : "hot water" } }, { "match" : { "query" : "cold porridge" } } ] } } ] } } } } }
intervals
的顶层参数
编辑match
规则参数
编辑match
规则匹配已分析的文本。
-
query
- (必需,字符串) 您希望在提供的
<field>
中查找的文本。 -
max_gaps
-
(可选,整数) 匹配项之间最大位置数。距离大于此值的词项不被视为匹配项。默认为
-1
。如果未指定或设置为
-1
,则匹配没有宽度限制。如果设置为0
,则词项必须彼此相邻。 -
ordered
- (可选,布尔值) 如果为
true
,则匹配项必须按其指定的顺序出现。默认为false
。 -
analyzer
- (可选,字符串) 用于分析
query
中词项的分析器。默认为顶层<field>
的分析器。 -
filter
- (可选,间隔过滤器规则对象) 一个可选的间隔过滤器。
-
use_field
- (可选,字符串) 如果指定,则从此字段匹配间隔,而不是从顶层
<field>
匹配间隔。词项使用此字段的搜索分析器进行分析。这允许您像搜索同一字段一样跨多个字段进行搜索;例如,您可以将相同的文本索引到词干字段和非词干字段中,并搜索词干标记附近的非词干标记。
prefix
规则参数
编辑prefix
规则匹配以指定字符集开头的词项。此前缀可以扩展为最多匹配 indices.query.bool.max_clause_count
搜索设置个词项。如果前缀匹配的词项过多,Elasticsearch 将返回错误。您可以使用字段映射中的 index-prefixes
选项来避免此限制。
-
prefix
- (必需,字符串) 您希望在顶层
<field>
中查找的词项的起始字符。 -
analyzer
- (可选,字符串) 用于规范化
prefix
的分析器。默认为顶层<field>
的分析器。 -
use_field
-
(可选,字符串) 如果指定,则从此字段匹配间隔,而不是从顶层
<field>
匹配间隔。prefix
使用此字段的搜索分析器进行规范化,除非单独指定了analyzer
。
wildcard
规则参数
编辑wildcard
规则使用通配符模式匹配词项。此模式可以扩展为最多匹配 indices.query.bool.max_clause_count
搜索设置个词项。如果模式匹配的词项过多,Elasticsearch 将返回错误。
-
pattern
-
(必需,字符串) 用于查找匹配词项的通配符模式。
此参数支持两个通配符运算符
-
?
,它匹配任何单个字符 -
*
,它可以匹配零个或多个字符,包括空字符
避免以
*
或?
开头的模式。这会增加查找匹配项所需的迭代次数,并降低搜索性能。 -
-
analyzer
- (可选,字符串) 用于规范化
pattern
的分析器。默认为顶层<field>
的分析器。 -
use_field
-
(可选,字符串) 如果指定,则从此字段匹配间隔,而不是从顶层
<field>
匹配间隔。pattern
使用此字段的搜索分析器进行规范化,除非单独指定了analyzer
。
regexp
规则参数
编辑regexp
规则使用正则表达式模式匹配词项。此模式可以扩展为最多匹配 indices.query.bool.max_clause_count
搜索设置个词项。如果模式匹配的词项过多,Elasticsearch 将返回错误。
-
pattern
- (必需,字符串) 用于查找匹配词项的正则表达式模式。有关
regexp
模式支持的运算符列表,请参阅正则表达式语法。
避免使用通配符模式,例如 .*
或 .*?+`
。这会增加查找匹配项所需的迭代次数,并降低搜索性能。
-
analyzer
- (可选,字符串) 用于规范化
pattern
的分析器。默认为顶层<field>
的分析器。
-
use_field
-
(可选,字符串) 如果指定,则从此字段匹配间隔,而不是从顶层
<field>
匹配间隔。pattern
使用此字段的搜索分析器进行规范化,除非单独指定了analyzer
。
fuzzy
规则参数
编辑fuzzy
规则匹配与提供的词项相似的词项,其编辑距离由模糊性定义。如果模糊扩展匹配的词项多于 indices.query.bool.max_clause_count
搜索设置个词项,Elasticsearch 将返回错误。
-
term
- (必需,字符串) 要匹配的词项
-
prefix_length
- (可选,整数) 创建扩展时保持不变的起始字符数。默认为
0
。 -
transpositions
- (可选,布尔值) 指示编辑是否包括两个相邻字符的换位 (ab → ba)。默认为
true
。 -
fuzziness
- (可选,字符串) 允许匹配的最大编辑距离。有关有效值和更多信息,请参阅模糊性。默认为
auto
。 -
analyzer
- (可选,字符串) 用于规范化
term
的分析器。默认为顶层<field>
的分析器。 -
use_field
-
(可选,字符串) 如果指定,则从此字段匹配间隔,而不是从顶层
<field>
匹配间隔。term
使用此字段的搜索分析器进行规范化,除非单独指定了analyzer
。
range
规则参数
编辑range
规则匹配包含在提供的范围内的词项。此范围可以扩展为最多匹配 indices.query.bool.max_clause_count
搜索设置个词项。如果范围匹配的词项过多,Elasticsearch 将返回错误。
-
gt
- (可选,字符串) 大于:匹配大于提供的词项的词项。
-
gte
- (可选,字符串) 大于或等于:匹配大于或等于提供的词项的词项。
-
lt
- (可选,字符串) 小于:匹配小于提供的词项的词项。
-
lte
- (可选,字符串) 小于或等于:匹配小于或等于提供的词项的词项。
必须提供 gt
或 gte
参数之一。必须提供 lt
或 lte
参数之一。
-
analyzer
- (可选,字符串) 用于规范化
pattern
的分析器。默认为顶层<field>
的分析器。 -
use_field
- (可选,字符串) 如果指定,则从此字段匹配间隔,而不是从顶层
<field>
匹配间隔。
all_of
规则参数
编辑all_of
规则返回跨越其他规则组合的匹配项。
-
intervals
- (必需,规则对象数组) 要组合的规则数组。所有规则都必须在文档中产生匹配项,才能使整个源匹配。
-
max_gaps
-
(可选,整数) 匹配项之间最大位置数。由规则产生的间隔距离大于此值的不被视为匹配项。默认为
-1
。如果未指定或设置为
-1
,则匹配没有宽度限制。如果设置为0
,则词项必须彼此相邻。 -
ordered
- (可选,布尔值) 如果为
true
,则规则产生的间隔应按其指定的顺序出现。默认为false
。 -
filter
- (可选,间隔过滤器规则对象) 用于过滤返回的间隔的规则。
any_of
规则参数
编辑any_of
规则返回其任何子规则产生的间隔。
-
intervals
- (必需,规则对象数组) 要匹配的规则数组。
-
filter
- (可选,间隔过滤器规则对象) 用于过滤返回的间隔的规则。
filter
规则参数
编辑filter
规则根据查询返回间隔。有关示例,请参阅过滤器示例。
-
after
- (可选,查询对象) 用于返回来自
filter
规则的间隔之后的间隔的查询。 -
before
- (可选,查询对象) 用于返回来自
filter
规则的间隔之前的间隔的查询。 -
contained_by
- (可选,查询对象) 用于返回包含在来自
filter
规则的间隔内的间隔的查询。 -
containing
- (可选,查询对象) 用于返回包含来自
filter
规则的间隔的间隔的查询。 -
not_contained_by
- (可选,查询对象) 用于返回 不 包含在来自
filter
规则的间隔内的间隔的查询。 -
not_containing
- (可选,查询对象) 用于返回 不 包含来自
filter
规则的间隔的间隔的查询。 -
not_overlapping
- (可选,查询对象) 用于返回与来自
filter
规则的间隔 不 重叠的间隔的查询。 -
overlapping
- (可选,查询对象) 用于返回与来自
filter
规则的间隔重叠的间隔的查询。 -
script
- (可选,脚本对象) 用于返回匹配文档的脚本。此脚本必须返回布尔值,
true
或false
。有关示例,请参阅脚本过滤器。
说明
编辑过滤器示例
编辑以下搜索包含一个 filter
规则。它返回的文档中,单词 hot
和 porridge
彼此之间相距不超过 10 个位置,并且之间没有单词 salty
resp = client.search( query={ "intervals": { "my_text": { "match": { "query": "hot porridge", "max_gaps": 10, "filter": { "not_containing": { "match": { "query": "salty" } } } } } } }, ) print(resp)
response = client.search( body: { query: { intervals: { my_text: { match: { query: 'hot porridge', max_gaps: 10, filter: { not_containing: { match: { query: 'salty' } } } } } } } } ) puts response
const response = await client.search({ query: { intervals: { my_text: { match: { query: "hot porridge", max_gaps: 10, filter: { not_containing: { match: { query: "salty", }, }, }, }, }, }, }, }); console.log(response);
POST _search { "query": { "intervals" : { "my_text" : { "match" : { "query" : "hot porridge", "max_gaps" : 10, "filter" : { "not_containing" : { "match" : { "query" : "salty" } } } } } } } }
脚本过滤器
编辑您可以使用脚本根据间隔的起始位置、结束位置和内部间隙计数来过滤间隔。以下 filter
脚本使用 interval
变量以及 start
、end
和 gaps
方法
resp = client.search( query={ "intervals": { "my_text": { "match": { "query": "hot porridge", "filter": { "script": { "source": "interval.start > 10 && interval.end < 20 && interval.gaps == 0" } } } } } }, ) print(resp)
response = client.search( body: { query: { intervals: { my_text: { match: { query: 'hot porridge', filter: { script: { source: 'interval.start > 10 && interval.end < 20 && interval.gaps == 0' } } } } } } } ) puts response
const response = await client.search({ query: { intervals: { my_text: { match: { query: "hot porridge", filter: { script: { source: "interval.start > 10 && interval.end < 20 && interval.gaps == 0", }, }, }, }, }, }, }); console.log(response);
POST _search { "query": { "intervals" : { "my_text" : { "match" : { "query" : "hot porridge", "filter" : { "script" : { "source" : "interval.start > 10 && interval.end < 20 && interval.gaps == 0" } } } } } } }
最小化
编辑间隔查询始终会最小化间隔,以确保查询可以在线性时间内运行。这有时可能会导致令人惊讶的结果,尤其是在使用 max_gaps
限制或过滤器时。例如,以下查询搜索短语 hot porridge
中包含的 salty
resp = client.search( query={ "intervals": { "my_text": { "match": { "query": "salty", "filter": { "contained_by": { "match": { "query": "hot porridge" } } } } } } }, ) print(resp)
response = client.search( body: { query: { intervals: { my_text: { match: { query: 'salty', filter: { contained_by: { match: { query: 'hot porridge' } } } } } } } } ) puts response
const response = await client.search({ query: { intervals: { my_text: { match: { query: "salty", filter: { contained_by: { match: { query: "hot porridge", }, }, }, }, }, }, }, }); console.log(response);
POST _search { "query": { "intervals" : { "my_text" : { "match" : { "query" : "salty", "filter" : { "contained_by" : { "match" : { "query" : "hot porridge" } } } } } } } }
此查询 不 匹配包含短语 hot porridge is salty porridge
的文档,因为 hot porridge
的匹配查询返回的间隔仅覆盖此文档中的前两个术语,并且这些间隔与覆盖 salty
的间隔不重叠。
On this page