Elasticsearch 指南其他版本
8.17 中的新功能
Elasticsearch 基础
- 什么是 Elasticsearch?
- 运行 Elasticsearch
- 索引和文档
- 向 Elasticsearch 添加数据
- 搜索和分析数据
- 为生产环境做好准备
快速入门
- 基础：使用 API 进行索引和搜索
- 基础：全文搜索和过滤
- 基础：使用聚合分析电子商务数据
设置 Elasticsearch
- 在本地运行 Elasticsearch
- 安装 Elasticsearch
- 配置 Elasticsearch
- 重要的系统配置
- 引导检查
- X-Pack 的引导检查
- 启动 Elasticsearch
- 停止 Elasticsearch
- 发现和集群形成
- 在集群中添加和删除节点
- 完整集群重启和滚动重启
- 远程集群
- 插件
升级 Elasticsearch
- 已存档设置
- 从较旧的 Elasticsearch 版本读取索引
索引模块
- 分析
- 索引分片分配
- 索引块
- 映射器
- 合并
- 相似度模块
- 慢日志
- 存储
  - 将数据预加载到文件系统缓存中
- 事务日志
- 历史记录保留
- 索引排序
  - 使用索引排序来加速 conjunctions
- 索引压力
映射
- 动态映射
  - 动态字段映射
  - 动态模板
- 显式映射
- 运行时字段
- 字段数据类型
  - 聚合度量
  - 别名
  - 数组
  - 二进制
  - 布尔值
  - 完成
  - 日期
  - 日期纳秒
  - 密集向量
  - 扁平化
  - 地理点
  - 地理形状
  - 直方图
  - IP
  - 连接
  - 关键词
  - 嵌套
  - 数值
  - 对象
  - 传递对象
  - 过滤器
  - 点
  - 范围
  - 排名特征
  - 排名特征
  - 即时搜索
  - 语义文本
  - 形状
  - 稀疏向量
  - 文本
  - 令牌计数
  - 无符号长整型
  - 版本
- 元数据字段
- 映射参数
- 映射限制设置
- 删除映射类型
文本分析
- 概述
- 概念
- 配置文本分析
- 内置分析器参考
  - 指纹
  - 关键词
  - 语言
  - 模式
  - 简单
  - 标准
  - 停止
  - 空格
- 分词器参考
  - 字符组
  - 经典
  - 边缘 N 元
  - 关键词
  - 字母
  - 小写
  - N 元
  - 路径层次结构
  - 模式
  - 简单模式
  - 简单模式分割
  - 标准
  - 泰语
  - UAX URL 电子邮件
  - 空格
- 令牌过滤器参考
  - 省略号
  - ASCII 折叠
  - CJK 双字母
  - CJK 宽度
  - 经典
  - 常用语法
  - 条件
  - 十进制数字
  - 分隔的有效负载
  - 字典复合器
  - 边缘 N 元
  - 省略
  - 指纹
  - 扁平图
  - Hunspell
  - 连字符复合器
  - 保留类型
  - 保留单词
  - 关键字标记
  - 关键字重复
  - KStem
  - 长度
  - 限制令牌计数
  - 小写
  - MinHash
  - 多路复用器
  - N 元
  - 规范化
  - 模式捕获
  - 模式替换
  - 语音
  - Porter 词干
  - 谓词脚本
  - 删除重复项
  - 反转
  - 瓦片
  - 雪球
  - 词干分析器
  - 词干分析器覆盖
  - 停止
  - 同义词
  - 同义词图
  - 修剪
  - 截断
  - 唯一
  - 大写
  - 单词分隔符
  - 单词分隔符图
- 字符过滤器参考
- 规范化器
索引模板
- 模拟多组件模板
- 配置 ignore_missing_component_templates
  - 使用示例
数据流
- 设置数据流
- 使用数据流
- 修改数据流
- 时间序列数据流 (TSDS)
- 日志数据流
- 数据流生命周期
摄取管道
- 示例：解析日志
- 丰富您的数据
- 处理器参考
  - 附加
  - 附件
  - 字节
  - 圆
  - 社区 ID
  - 转换
  - CSV
  - 日期
  - 日期索引名称
  - 剖析
  - 点扩展器
  - 丢弃
  - 丰富
  - 失败
  - 指纹
  - 循环
  - 地理网格
  - GeoIP
  - Grok
  - Gsub
  - HTML 条
  - 推理
  - IP 位置
  - 连接
  - JSON
  - KV
  - 小写
  - 网络方向
  - 管道
  - 编辑
  - 注册域
  - 删除
  - 重命名
  - 重新路由
  - 脚本
  - 设置
  - 设置安全用户
  - 排序
  - 拆分
  - 终止
  - 修剪
  - 大写
  - URL 解码
  - URI 部分
  - 用户代理
- 搜索中的摄取管道
  - 推理处理
  - NLP 教程
别名
搜索您的数据
- 搜索 API
- 搜索相关性优化
- 检索器
  - 检索器示例
- kNN 搜索
- 语义搜索
- 跨集群搜索
- 使用同义词搜索
- 搜索应用程序
- 搜索分析
重新排名
- 语义重新排名
- 学习排名
  - 部署和管理 LTR 模型
  - 使用 LTR 进行搜索
查询 DSL
- 查询和过滤器上下文
- 复合查询
- 全文查询
- 地理位置查询
- 形状查询
  - 形状
- 连接查询
  - 嵌套
  - 有子级
  - 有父级
  - 父级 ID
- 匹配所有
- 跨度查询
- 向量查询
  - Knn
  - 稀疏向量
  - 语义
  - 文本扩展
  - 加权标记
- 专用查询
  - 距离特征
  - 更像这样
  - 渗透
  - 排名特征
  - 脚本
  - 脚本评分
  - 包装器
  - 固定查询
  - 规则
- 词项级查询
  - 存在
  - 模糊
  - ID
  - 前缀
  - 范围
  - 正则表达式
  - 词项
  - 词项集
  - 词项集
  - 通配符
- minimum_should_match 参数
- rewrite 参数
- 正则表达式语法
聚合
- 桶聚合
- 指标聚合
- 管道聚合
地理空间分析
连接器
- 连接器引用
  - Azure Blob 存储
  - Box
  - Confluence
  - Dropbox
  - GitHub
  - Gmail
  - Google Cloud Storage
  - Google Drive
  - GraphQL
  - Jira
  - Microsoft SQL
  - MongoDB
  - MySQL
  - 网络驱动器
  - Notion
  - OneDrive
  - OpenText Documentum
  - Oracle
  - Outlook
  - PostgreSQL
  - Redis
  - S3
  - Salesforce
  - ServiceNow
  - SharePoint Online
  - SharePoint Server
  - Slack
  - Teams
  - Zoom
- 自管理连接器
- Elastic 管理的连接器
  - 管理连接器教程 (MongoDB)
- 构建和自定义连接器
- Kibana 中的连接器 UI
- 连接器 API
  - API 教程
- 内容同步
- 提取和转换
  - 内容提取
  - 同步规则
- 文档级安全性
  - DLS 的工作原理
  - 搜索应用程序中的 DLS
- 管理主题
- 用例
  - 内部知识搜索
- 发行说明
- 已知问题
EQL
- 语法参考
- 函数参考
- 管道参考
- 示例：使用 EQL 检测威胁
ES|QL
- 入门
- ES|QL 参考
- 使用 ES|QL
- 限制
- 示例
SQL
- 概述
- SQL 入门
- 约定和术语
  - 跨 SQL 和 Elasticsearch 的映射概念
- 安全
- SQL REST API
- SQL 转换 API
- SQL CLI
- SQL JDBC
  - API 用法
- SQL ODBC
  - 驱动程序安装
  - 配置
- SQL 客户端应用程序
- SQL 语言
- 函数和运算符
- 保留关键字
- SQL 限制
脚本
- Painless 脚本语言
- 如何编写脚本
- 访问文档中的字段
- 常见脚本用例
  - 字段提取
- 访问文档字段和特殊变量
- 脚本和安全性
- Lucene 表达式语言
- 使用脚本引擎的高级脚本
数据管理
- ILM：管理索引生命周期
- 教程：自定义内置策略
- 教程：自动翻转
- Kibana 中的索引管理
- 概述
- 概念
- 索引生命周期操作
  - 分配
  - 删除
  - 强制合并
  - 迁移
  - 只读
  - 翻转
  - 降采样
  - 可搜索快照
  - 设置优先级
  - 收缩
  - 取消关注
  - 等待快照
- 配置生命周期策略
- 将索引分配过滤器迁移到节点角色
- 解决索引生命周期管理错误
- 启动和停止索引生命周期管理
- 管理现有索引
- 跳过翻转
- 还原托管数据流或索引
- 数据层
自动缩放
- 自动缩放决策器
监视集群
- 概述
- 工作原理
- 在生产环境中监视
- 使用 Elastic Agent 收集监视数据
- 使用 Metricbeat 收集监视数据
- 使用 Filebeat 收集日志数据
- 配置用于监视的数据流/索引
- 旧版收集方法
汇总或转换数据
- 汇总历史数据
- 转换数据
设置高可用性集群
- 弹性设计
  - 小型集群中的弹性
  - 大型集群中的弹性
- 跨集群复制
快照和还原
- 注册存储库
- 创建快照
- 还原快照
- 可搜索快照
保护 Elastic Stack 的安全
- Elasticsearch 安全原则
- 自动启用安全性启动 Elastic Stack
- 手动配置安全性
- 更新节点安全证书
  - 使用相同的 CA
  - 使用不同的 CA
- 用户身份验证
- 用户授权
- 启用审计日志
- 使用 IP 过滤限制连接
- 保护客户端和集成
- 操作员权限
- 故障排除
- 限制
Watcher
- Watcher 入门
- Watcher 的工作原理
- 在 Watcher 中加密敏感数据
- 输入
- 触发器
  - 计划触发器
- 条件
- 操作
- 转换
- 管理监控
- 示例监控
  - 监控 Elasticsearch 集群的状态
- 限制
命令行工具
- elasticsearch-certgen
- elasticsearch-certutil
- elasticsearch-create-enrollment-token
- elasticsearch-croneval
- elasticsearch-keystore
- elasticsearch-node
- elasticsearch-reconfigure-node
- elasticsearch-reset-password
- elasticsearch-saml-metadata
- elasticsearch-service-tokens
- elasticsearch-setup-passwords
- elasticsearch-shard
- elasticsearch-syskeygen
- elasticsearch-users
优化
- 一般建议
- 调整索引速度
- 调整搜索速度
- 调整近似 kNN 搜索
- 调整磁盘使用量
- 调整分片大小
- 将 Elasticsearch 用于时间序列数据
故障排除
- 修复常见的集群问题
  - 水位错误
  - 断路器错误
  - 高 CPU 使用率
  - 高 JVM 内存压力
  - 红色或黄色集群健康状态
  - 拒绝的请求
  - 任务队列积压
  - 映射爆炸
  - 热点
- 诊断未分配的分片
- 向系统中添加丢失的层
- 允许 Elasticsearch 在系统中分配数据
- 允许 Elasticsearch 分配索引
- 索引将索引分配过滤器与数据层节点角色混合，以在数据层之间移动
- 没有足够的节点来分配所有分片副本
- 单个节点上索引的分片总数已超过
- 每个节点的分片总数已达到
- 故障排除损坏
- 修复磁盘空间不足的数据节点
  - 增加数据节点的磁盘容量
  - 减少数据节点的磁盘使用量
- 修复磁盘空间不足的主节点
- 修复磁盘空间不足的其他角色节点
- 启动索引生命周期管理
- 启动快照生命周期管理
- 从快照恢复
- 故障排除损坏的存储库
  - 诊断损坏的存储库
  - 诊断未知存储库
  - 诊断无效存储库
- 解决重复的快照策略失败问题
- 故障排除不稳定的集群
- 故障排除发现
- 故障排除监控
- 故障排除转换
- 故障排除 Watcher
- 故障排除搜索
- 故障排除分片容量健康问题
- 故障排除不平衡的集群
- 捕获诊断信息
REST API
- API 约定
- 通用选项
- REST API 兼容性
- 自动缩放 API
  - 创建或更新自动缩放策略
  - 获取自动缩放容量
  - 删除自动缩放策略
  - 获取自动缩放策略
- 行为分析 API
  - 放置分析集合
  - 删除分析集合
  - 列出分析集合
  - 发布分析集合事件
- 紧凑和对齐文本 (CAT) API
  - cat 别名
  - cat 分配
  - cat 异常检测器
  - cat 组件模板
  - cat 计数
  - cat 数据帧分析
  - cat 数据馈送
  - cat 字段数据
  - cat 健康
  - cat 索引
  - cat 主节点
  - cat 节点属性
  - cat 节点
  - cat 待处理任务
  - cat 插件
  - cat 恢复
  - cat 存储库
  - cat 段
  - cat 分片
  - cat 快照
  - cat 任务管理
  - cat 模板
  - cat 线程池
  - cat 训练模型
  - cat 转换
- 集群 API
  - 集群分配解释
  - 集群获取设置
  - 集群健康
  - 健康
  - 集群重新路由
  - 集群状态
  - 集群统计信息
  - 集群更新设置
  - 节点功能使用情况
  - 节点热线程
  - 节点信息
  - 预验证节点移除
  - 节点重新加载安全设置
  - 节点统计信息
  - 集群信息
  - 待处理的集群任务
  - 远程集群信息
  - 任务管理
  - 投票配置排除项
  - 创建或更新所需节点
  - 获取所需节点
  - 删除所需节点
  - 获取所需平衡
  - 重置所需平衡
- 跨集群复制 API
  - 获取 CCR 统计信息
  - 创建跟随者
  - 暂停跟随者
  - 恢复跟随者
  - 取消关注
  - 忘记跟随者
  - 获取跟随者统计信息
  - 获取跟随者信息
  - 创建自动跟随模式
  - 删除自动跟随模式
  - 获取自动跟随模式
  - 暂停自动跟随模式
  - 恢复自动跟随模式
- 连接器 API
  - 创建连接器
  - 删除连接器
  - 获取连接器
  - 列出连接器
  - 更新连接器 API 密钥 ID
  - 更新连接器配置
  - 更新连接器索引名称
  - 更新连接器功能
  - 更新连接器筛选
  - 更新连接器名称和描述
  - 更新连接器管道
  - 更新连接器调度
  - 更新连接器服务类型
  - 创建连接器同步作业
  - 取消连接器同步作业
  - 删除连接器同步作业
  - 获取连接器同步作业
  - 列出连接器同步作业
  - 检入连接器
  - 更新连接器错误
  - 更新连接器上次同步统计信息
  - 更新连接器状态
  - 检入连接器同步作业
  - 声明连接器同步作业
  - 设置连接器同步作业错误
  - 设置连接器同步作业统计信息
- 数据流 API
  - 创建数据流
  - 删除数据流
  - 获取数据流
  - 迁移到数据流
  - 数据流统计信息
  - 升级数据流
  - 修改数据流
  - 放置数据流生命周期
  - 获取数据流生命周期
  - 删除数据流生命周期
  - 解释数据流生命周期
  - 获取数据流生命周期
  - 降采样
- 文档 API
  - 读取和写入文档
  - 索引
  - 获取
  - 删除
  - 按查询删除
  - 更新
  - 按查询更新
  - 多重获取
  - 批量
  - 重新索引
  - 词条向量
  - 多词条向量
  - ?refresh
  - 乐观并发控制
- 丰富 API
  - 创建丰富策略
  - 删除丰富策略
  - 获取丰富策略
  - 执行丰富策略
  - 丰富统计信息
- EQL API
  - 删除异步 EQL 搜索
  - EQL 搜索
  - 获取异步 EQL 搜索
  - 获取异步 EQL 搜索状态
- ES|QL API
  - ES|QL 查询 API
  - ES|QL 异步查询 API
  - ES|QL 异步查询获取 API
  - ES|QL 异步查询删除 API
- 功能 API
  - 获取功能
  - 重置功能
- Fleet API
  - 获取全局检查点
  - Fleet 搜索
  - Fleet 多重搜索
- 图表探索 API
- 索引 API
  - 别名是否存在
  - 别名
  - 分析
  - 分析索引磁盘使用量
  - 清除缓存
  - 克隆索引
  - 关闭索引
  - 创建索引
  - 创建或更新别名
  - 创建或更新组件模板
  - 创建或更新索引模板
  - 创建或更新索引模板（旧版）
  - 删除组件模板
  - 删除悬挂索引
  - 删除别名
  - 删除索引
  - 删除索引模板
  - 删除索引模板（旧版）
  - 存在
  - 字段使用情况统计信息
  - 刷新
  - 强制合并
  - 获取别名
  - 获取组件模板
  - 获取字段映射
  - 获取索引
  - 获取索引设置
  - 获取索引模板
  - 获取索引模板（旧版）
  - 获取映射
  - 导入悬挂索引
  - 索引恢复
  - 索引段
  - 索引分片存储
  - 索引统计信息
  - 索引模板是否存在（旧版）
  - 列出悬挂索引
  - 打开索引
  - 刷新
  - 解析索引
  - 解析集群
  - 翻转
  - 收缩索引
  - 模拟索引
  - 模拟模板
  - 拆分索引
  - 解冻索引
  - 更新索引设置
  - 更新映射
- 索引生命周期管理 API
  - 创建或更新生命周期策略
  - 获取策略
  - 删除策略
  - 移动到步骤
  - 删除策略
  - 重试策略
  - 获取索引生命周期管理状态
  - 解释生命周期
  - 启动索引生命周期管理
  - 停止索引生命周期管理
  - 将索引、ILM 策略以及旧版、可组合和组件模板迁移到数据层路由
- 推理 API
  - 删除推理 API
  - 获取推理 API
  - 执行推理 API
  - 创建推理 API
  - 流式推理 API
  - 更新推理 API
  - 阿里云 AI 搜索推理服务
  - Amazon Bedrock 推理服务
  - Anthropic 推理服务
  - Azure AI Studio 推理服务
  - Azure OpenAI 推理服务
  - Cohere 推理服务
  - Elasticsearch 推理服务
  - ELSER 推理服务
  - Google AI Studio 推理服务
  - Google Vertex AI 推理服务
  - HuggingFace 推理服务
  - Mistral 推理服务
  - OpenAI 推理服务
  - Watsonx 推理服务
- 信息 API
- 摄取 API
  - 创建或更新管道
  - 获取管道
  - 删除管道
  - 模拟管道
  - 模拟摄取
  - GeoIP 统计
  - 创建或更新 IP 地理位置数据库配置
  - 获取 IP 地理位置数据库配置
  - 删除 IP 地理位置数据库配置
- 许可 API
  - 删除许可证
  - 获取许可证
  - 获取试用状态
  - 开始试用
  - 获取基本状态
  - 开始基本版
  - 更新许可证
- Logstash API
  - 创建或更新 Logstash 管道
  - 删除 Logstash 管道
  - 获取 Logstash 管道
- 机器学习 API
  - 获取机器学习信息
  - 获取机器学习内存统计
  - 设置升级模式
- 机器学习异常检测 API
  - 向日历添加事件
  - 向日历添加作业
  - 关闭作业
  - 创建作业
  - 创建日历
  - 创建数据源
  - 创建过滤器
  - 删除日历
  - 删除数据源
  - 从日历中删除事件
  - 删除过滤器
  - 删除预测
  - 删除作业
  - 从日历中删除作业
  - 删除模型快照
  - 删除过期数据
  - 估计模型内存
  - 刷新作业
  - 预测作业
  - 获取存储桶
  - 获取日历
  - 获取类别
  - 获取数据源
  - 获取数据源统计
  - 获取影响因素
  - 获取作业
  - 获取作业统计
  - 获取模型快照
  - 获取模型快照升级统计
  - 获取总体存储桶
  - 获取计划事件
  - 获取过滤器
  - 获取记录
  - 打开作业
  - 向作业发布数据
  - 预览数据源
  - 重置作业
  - 还原模型快照
  - 启动数据源
  - 停止数据源
  - 更新数据源
  - 更新过滤器
  - 更新作业
  - 更新模型快照
  - 升级模型快照
- 机器学习数据帧分析 API
  - 创建数据帧分析作业
  - 删除数据帧分析作业
  - 评估数据帧分析
  - 解释数据帧分析
  - 获取数据帧分析作业
  - 获取数据帧分析作业统计
  - 预览数据帧分析
  - 启动数据帧分析作业
  - 停止数据帧分析作业
  - 更新数据帧分析作业
- 机器学习训练模型 API
  - 清除训练模型部署缓存
  - 创建或更新训练模型别名
  - 创建训练模型的一部分
  - 创建训练模型
  - 创建训练模型词汇表
  - 删除训练模型别名
  - 删除训练模型
  - 获取训练模型
  - 获取训练模型统计
  - 推断训练模型
  - 启动训练模型部署
  - 停止训练模型部署
  - 更新训练模型部署
- 迁移 API
  - 弃用信息
  - 功能迁移
- 节点生命周期 API
  - 放置关闭 API
  - 获取关闭 API
  - 删除关闭 API
- 查询规则 API
  - 创建或更新查询规则集
  - 获取查询规则集
  - 列出查询规则集
  - 删除查询规则集
  - 创建或更新查询规则
  - 获取查询规则
  - 删除查询规则
  - 测试查询规则集
- 重新加载搜索分析器 API
- 存储库计量 API
  - 获取存储库计量信息
  - 清除存储库计量存档
- 汇总 API
  - 创建汇总作业
  - 删除汇总作业
  - 获取作业
  - 获取汇总上限
  - 获取汇总索引上限
  - 汇总搜索
  - 启动汇总作业
  - 停止汇总作业
- 根 API
- 脚本 API
  - 创建或更新存储脚本
  - 删除存储脚本
  - 获取脚本上下文
  - 获取脚本语言
  - 获取存储脚本
- 搜索 API
  - 搜索
  - 异步搜索
  - 时间点
  - kNN 搜索
  - 检索器
  - 倒数排名融合
  - 滚动
  - 清除滚动
  - 搜索模板
  - 多搜索模板
  - 渲染搜索模板
  - 搜索分片
  - 建议器
  - 多搜索
  - 计数
  - 验证
  - 术语枚举
  - 解释
  - 剖析
  - 字段功能
  - 排名评估
  - 矢量图块搜索
- 搜索应用程序 API
  - 放置搜索应用程序
  - 获取搜索应用程序
  - 列出搜索应用程序
  - 删除搜索应用程序
  - 搜索应用程序搜索
  - 渲染搜索应用程序查询
- 可搜索快照 API
  - 挂载快照
  - 缓存统计
  - 可搜索快照统计
  - 清除缓存
- 安全 API
  - 身份验证
  - 更改密码
  - 清除缓存
  - 清除角色缓存
  - 清除权限缓存
  - 清除 API 密钥缓存
  - 清除服务帐户令牌缓存
  - 创建 API 密钥
  - 创建或更新应用程序权限
  - 创建或更新角色映射
  - 创建或更新角色
  - 批量创建或更新角色 API
  - 批量删除角色 API
  - 创建或更新用户
  - 创建服务帐户令牌
  - 委托 PKI 身份验证
  - 删除应用程序权限
  - 删除角色映射
  - 删除角色
  - 删除服务帐户令牌
  - 删除用户
  - 禁用用户
  - 启用用户
  - 注册 Kibana
  - 注册节点
  - 获取 API 密钥信息
  - 获取应用程序权限
  - 获取内置权限
  - 获取角色映射
  - 获取角色
  - 查询角色
  - 获取服务帐户
  - 获取服务帐户凭据
  - 获取安全设置
  - 获取令牌
  - 获取用户权限
  - 获取用户
  - 授予 API 密钥
  - 具有权限
  - 使 API 密钥失效
  - 使令牌失效
  - OpenID Connect 准备身份验证
  - OpenID Connect 身份验证
  - OpenID Connect 注销
  - 查询 API 密钥信息
  - 查询用户
  - 更新 API 密钥
  - 更新安全设置
  - 批量更新 API 密钥
  - SAML 准备身份验证
  - SAML 身份验证
  - SAML 注销
  - SAML 失效
  - SAML 完成注销
  - SAML 服务提供商元数据
  - SSL 证书
  - 激活用户配置文件
  - 禁用用户配置文件
  - 启用用户配置文件
  - 获取用户配置文件
  - 建议用户配置文件
  - 更新用户配置文件数据
  - 具有用户配置文件权限
  - 创建跨集群 API 密钥
  - 更新跨集群 API 密钥
- 快照和还原 API
  - 创建或更新快照存储库
  - 验证快照存储库
  - 存储库分析
  - 验证存储库完整性
  - 获取快照存储库
  - 删除快照存储库
  - 清理快照存储库
  - 克隆快照
  - 创建快照
  - 获取快照
  - 获取快照状态
  - 还原快照
  - 删除快照
- 快照生命周期管理 API
  - 创建或更新策略
  - 获取策略
  - 删除策略
  - 执行快照生命周期策略
  - 执行快照保留策略
  - 获取快照生命周期管理状态
  - 获取快照生命周期统计
  - 启动快照生命周期管理
  - 停止快照生命周期管理
- SQL API
  - 清除 SQL 光标
  - 删除异步 SQL 搜索
  - 获取异步 SQL 搜索
  - 获取异步 SQL 搜索状态
  - SQL 搜索
  - SQL 转换
- 同义词 API
  - 创建或更新同义词集
  - 获取同义词集
  - 列出同义词集
  - 删除同义词集
  - 创建或更新同义词规则
  - 获取同义词规则
  - 删除同义词规则
- 文本结构 API
  - 查找字段结构 API
  - 查找消息结构 API
  - 查找文本结构 API
  - 测试 Grok 模式
- 转换 API
  - 创建转换
  - 删除转换
  - 获取转换
  - 获取转换统计
  - 预览转换
  - 重置转换
  - 立即计划转换
  - 启动转换
  - 停止转换
  - 更新转换
  - 升级转换
- 使用情况 API
- Watcher API
  - 确认观察
  - 激活观察
  - 停用观察
  - 删除观察
  - 执行观察
  - 获取观察
  - 获取 Watcher 统计
  - 查询观察
  - 创建或更新观察
  - 更新 Watcher 设置
  - 获取 Watcher 设置
  - 启动观察服务
  - 停止观察服务
- 定义
  - 角色映射资源
迁移指南
- 8.17
- 8.16
- 8.15
- 8.14
- 8.13
- 8.12
- 8.11
- 8.10
- 8.9
- 8.8
- 8.7
- 8.6
- 8.5
- 8.4
- 8.3
- 8.2
- 8.1
- 8.0
  - Java 时间迁移指南
  - 瞬态设置迁移指南
发行说明
- Elasticsearch 版本 8.17.0
- Elasticsearch 版本 8.16.1
- Elasticsearch 版本 8.16.0
- Elasticsearch 版本 8.15.5
- Elasticsearch 版本 8.15.4
- Elasticsearch 版本 8.15.3
- Elasticsearch 版本 8.15.2
- Elasticsearch 版本 8.15.1
- Elasticsearch 版本 8.15.0
- Elasticsearch 版本 8.14.3
- Elasticsearch 版本 8.14.2
- Elasticsearch 版本 8.14.1
- Elasticsearch 版本 8.14.0
- Elasticsearch 版本 8.13.4
- Elasticsearch 版本 8.13.3
- Elasticsearch 版本 8.13.2
  - 错误修复
- Elasticsearch 版本 8.13.1
  - 错误修复
- Elasticsearch 版本 8.13.0
- Elasticsearch 版本 8.12.2
- Elasticsearch 版本 8.12.1
- Elasticsearch 版本 8.12.0
- Elasticsearch 版本 8.11.4
- Elasticsearch 版本 8.11.3
- Elasticsearch 版本 8.11.2
- Elasticsearch 版本 8.11.1
- Elasticsearch 版本 8.11.0
- Elasticsearch 版本 8.10.4
- Elasticsearch 版本 8.10.3
- Elasticsearch 版本 8.10.2
- Elasticsearch 版本 8.10.1
- Elasticsearch 版本 8.10.0
- Elasticsearch 版本 8.9.2
- Elasticsearch 版本 8.9.1
- Elasticsearch 版本 8.9.0
- Elasticsearch 版本 8.8.2
- Elasticsearch 版本 8.8.1
- Elasticsearch 版本 8.8.0
- Elasticsearch 版本 8.7.1
- Elasticsearch 版本 8.7.0
- Elasticsearch 版本 8.6.2
- Elasticsearch 版本 8.6.1
- Elasticsearch 版本 8.6.0
- Elasticsearch 版本 8.5.3
- Elasticsearch 版本 8.5.2
- Elasticsearch 版本 8.5.1
- Elasticsearch 版本 8.5.0
- Elasticsearch 版本 8.4.3
- Elasticsearch 版本 8.4.2
- Elasticsearch 版本 8.4.1
- Elasticsearch 版本 8.4.0
- Elasticsearch 版本 8.3.3
- Elasticsearch 版本 8.3.2
- Elasticsearch 版本 8.3.1
- Elasticsearch 版本 8.3.0
- Elasticsearch 版本 8.2.3
- Elasticsearch 版本 8.2.2
- Elasticsearch 版本 8.2.1
- Elasticsearch 版本 8.2.0
- Elasticsearch 版本 8.1.3
- Elasticsearch 版本 8.1.2
- Elasticsearch 版本 8.1.1
- Elasticsearch 版本 8.1.0
- Elasticsearch 版本 8.0.1
- Elasticsearch 版本 8.0.0
- Elasticsearch 版本 8.0.0-rc2
- Elasticsearch 版本 8.0.0-rc1
- Elasticsearch 版本 8.0.0-beta1
- Elasticsearch 版本 8.0.0-alpha2
- Elasticsearch 版本 8.0.0-alpha1
依赖项和版本

› › ›

Reindex API

编辑

Reindex API

编辑

将文档从源复制到目标。

源可以是任何现有的索引、别名或数据流。目标必须与源不同。例如，你不能将数据流重新索引到其自身。

Reindex 要求为源中的所有文档启用 _source。

在调用 _reindex 之前，应根据需要配置目标。Reindex 不会复制源或其关联模板的设置。

必须提前配置映射、分片计数、副本等。

resp = client.reindex(
    source={
        "index": "my-index-000001"
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'my-index-000001'
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    index: "my-index-000001",
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "my-index-000001"
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

请求

编辑

POST /_reindex

前提条件

编辑

如果启用了 Elasticsearch 安全功能，你必须拥有以下安全权限
- 源数据流、索引或别名的 read 索引权限。
- 目标数据流、索引或索引别名的 write 索引权限。
- 要使用 reindex API 请求自动创建数据流或索引，你必须拥有目标数据流、索引或别名的 auto_configure、create_index 或 manage 索引权限。
- 如果从远程集群重新索引，source.remote.user 必须拥有源数据流、索引或别名的 monitor 集群权限和 read 索引权限。
如果从远程集群重新索引，你必须在 elasticsearch.yml 的 reindex.remote.whitelist 设置中显式允许远程主机。请参阅从远程重新索引。
自动创建数据流需要启用数据流的匹配索引模板。请参阅 设置数据流。

描述

编辑

从源索引中提取文档源，并将文档索引到目标索引中。你可以将所有文档复制到目标索引，或者重新索引文档的子集。

就像 _update_by_query 一样，_reindex 获取源的快照，但其目标必须不同，因此不太可能发生版本冲突。可以像 index API 一样配置 dest 元素以控制乐观并发控制。省略 version_type 或将其设置为 internal 会导致 Elasticsearch 将文档盲目地转储到目标中，覆盖任何具有相同 ID 的文档。

将 version_type 设置为 external 会导致 Elasticsearch 保留源中的 version，创建任何丢失的文档，并更新目标中版本较旧的任何文档。

将 op_type 设置为 create 会导致 _reindex 仅在目标中创建丢失的文档。所有现有文档都将导致版本冲突。

由于数据流是仅追加的，因此对目标数据流的任何重新索引请求都必须具有 op_type of create。重新索引只能向目标数据流添加新文档。它无法更新目标数据流中的现有文档。

默认情况下，版本冲突会中止 _reindex 进程。要在存在冲突的情况下继续重新索引，请将 "conflicts" 请求主体参数设置为 proceed。在这种情况下，响应将包括遇到的版本冲突的计数。请注意，其他错误类型的处理不受 "conflicts" 参数的影响。此外，如果你选择计算版本冲突，则该操作可能会尝试从源中重新索引比 max_docs 更多的文档，直到它成功将 max_docs 文档索引到目标中，或者它已遍历了源查询中的每个文档。

异步运行重新索引

编辑

如果请求包含 wait_for_completion=false，则 Elasticsearch 会执行一些预检，启动请求，并返回一个 task，你可以使用该任务来取消或获取任务的状态。Elasticsearch 会在 _tasks/<task_id> 中创建此任务的记录作为文档。

从多个源重新索引

编辑

如果你有多个源要重新索引，通常最好一次重新索引一个源，而不是使用 glob 模式来选取多个源。这样，如果出现任何错误，你可以通过删除部分完成的源并重新开始来恢复该过程。这也使得并行处理过程非常简单：拆分要重新索引的源列表并并行运行每个列表。

一次性 bash 脚本似乎很适合此操作

for index in i1 i2 i3 i4 i5; do
  curl -HContent-Type:application/json -XPOST localhost:9200/_reindex?pretty -d'{
    "source": {
      "index": "'$index'"
    },
    "dest": {
      "index": "'$index'-reindexed"
    }
  }'
done

节流

编辑

将 requests_per_second 设置为任何正十进制数（1.4、6、1000 等），以限制 _reindex 发出索引操作批次的速度。通过用等待时间填充每个批次来限制请求。要禁用节流，请将 requests_per_second 设置为 -1。

节流是通过在批次之间等待来完成的，以便可以为 _reindex 在内部使用的 scroll 提供考虑到填充的超时时间。填充时间是批次大小除以 requests_per_second 与写入所花费的时间之间的差值。默认情况下，批次大小为 1000，因此，如果将 requests_per_second 设置为 500

target_time = 1000 / 500 per second = 2 seconds
wait_time = target_time - write_time = 2 seconds - .5 seconds = 1.5 seconds

由于批次是作为单个 _bulk 请求发出的，因此较大的批次大小会导致 Elasticsearch 创建许多请求，然后在开始下一组之前等待一段时间。这是“突发”而不是“平稳”。

重新节流

编辑

可以使用 _rethrottle API 在正在运行的重新索引上更改 requests_per_second 的值

$params = [
    'task_id' => 'r1A2WoRbTwKZ516z6NEs5A:36619',
];
$response = $client->reindexRethrottle($params);

resp = client.reindex_rethrottle(
    task_id="r1A2WoRbTwKZ516z6NEs5A:36619",
    requests_per_second="-1",
)
print(resp)

response = client.reindex_rethrottle(
  task_id: 'r1A2WoRbTwKZ516z6NEs5A:36619',
  requests_per_second: -1
)
puts response

res, err := es.ReindexRethrottle(
	"r1A2WoRbTwKZ516z6NEs5A:36619",
	esapi.IntPtr(-1),
)
fmt.Println(res, err)

const response = await client.reindexRethrottle({
  task_id: "r1A2WoRbTwKZ516z6NEs5A:36619",
  requests_per_second: "-1",
});
console.log(response);

POST _reindex/r1A2WoRbTwKZ516z6NEs5A:36619/_rethrottle?requests_per_second=-1

Copy as curl Try in Elastic

可以使用任务 API 找到任务 ID。

就像在 Reindex API 上设置它一样，requests_per_second 可以是 -1 以禁用节流，也可以是任何十进制数，例如 1.7 或 12 以将节流限制在该级别。加快查询速度的重新节流会立即生效，但是减慢查询速度的重新节流将在完成当前批次后生效。这样可以防止滚动超时。

切片

编辑

Reindex 支持切片滚动以并行化重新索引过程。这种并行化可以提高效率，并提供一种将请求分解为较小部分的便捷方式。

从远程集群重新索引不支持手动或自动切片。

手动切片

编辑

通过为每个请求提供切片 ID 和切片总数来手动切片重新索引请求

resp = client.reindex(
    source={
        "index": "my-index-000001",
        "slice": {
            "id": 0,
            "max": 2
        }
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

resp1 = client.reindex(
    source={
        "index": "my-index-000001",
        "slice": {
            "id": 1,
            "max": 2
        }
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp1)

response = client.reindex(
  body: {
    source: {
      index: 'my-index-000001',
      slice: {
        id: 0,
        max: 2
      }
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

response = client.reindex(
  body: {
    source: {
      index: 'my-index-000001',
      slice: {
        id: 1,
        max: 2
      }
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    index: "my-index-000001",
    slice: {
      id: 0,
      max: 2,
    },
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

const response1 = await client.reindex({
  source: {
    index: "my-index-000001",
    slice: {
      id: 1,
      max: 2,
    },
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response1);

POST _reindex
{
  "source": {
    "index": "my-index-000001",
    "slice": {
      "id": 0,
      "max": 2
    }
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}
POST _reindex
{
  "source": {
    "index": "my-index-000001",
    "slice": {
      "id": 1,
      "max": 2
    }
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

你可以通过以下方式验证此操作是否有效

resp = client.indices.refresh()
print(resp)

resp1 = client.search(
    index="my-new-index-000001",
    size="0",
    filter_path="hits.total",
)
print(resp1)

response = client.indices.refresh
puts response

response = client.search(
  index: 'my-new-index-000001',
  size: 0,
  filter_path: 'hits.total'
)
puts response

const response = await client.indices.refresh();
console.log(response);

const response1 = await client.search({
  index: "my-new-index-000001",
  size: 0,
  filter_path: "hits.total",
});
console.log(response1);

GET _refresh
POST my-new-index-000001/_search?size=0&filter_path=hits.total

Copy as curl Try in Elastic

这将产生一个像这样的合理 total

{
  "hits": {
    "total" : {
        "value": 120,
        "relation": "eq"
    }
  }
}

自动切片

编辑

你还可以让 _reindex 使用切片滚动在 _id 上进行切片来自动并行化。使用 slices 指定要使用的切片数

resp = client.reindex(
    slices="5",
    refresh=True,
    source={
        "index": "my-index-000001"
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  slices: 5,
  refresh: true,
  body: {
    source: {
      index: 'my-index-000001'
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  slices: 5,
  refresh: "true",
  source: {
    index: "my-index-000001",
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex?slices=5&refresh
{
  "source": {
    "index": "my-index-000001"
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

你还可以通过以下方式验证此操作是否有效

resp = client.search(
    index="my-new-index-000001",
    size="0",
    filter_path="hits.total",
)
print(resp)

response = client.search(
  index: 'my-new-index-000001',
  size: 0,
  filter_path: 'hits.total'
)
puts response

const response = await client.search({
  index: "my-new-index-000001",
  size: 0,
  filter_path: "hits.total",
});
console.log(response);

POST my-new-index-000001/_search?size=0&filter_path=hits.total

Copy as curl Try in Elastic

这将产生一个像这样的合理 total

{
  "hits": {
    "total" : {
        "value": 120,
        "relation": "eq"
    }
  }
}

将 slices 设置为 auto 将让 Elasticsearch 选择要使用的切片数。此设置将为每个分片使用一个切片，最多达到一定限制。如果存在多个源，它将根据分片数最少的索引或后备索引来选择切片数。

将 slices 添加到 _reindex 只是自动化了上述部分中使用的手动过程，创建了子请求，这意味着它有一些怪癖

你可以在任务 API 中查看这些请求。这些子请求是具有 slices 的请求任务的“子”任务。
获取具有 slices 的请求的任务状态仅包含已完成切片的状态。
这些子请求可以单独寻址，以进行诸如取消和重新节流之类的操作。
使用 slices 重新节流请求将按比例重新节流未完成的子请求。
使用 slices 取消请求将取消每个子请求。
由于 slices 的性质，每个子请求都不会获得完全均匀的文档部分。将处理所有文档，但是某些切片可能比其他切片大。期望较大的切片具有更均匀的分布。
具有 slices 的请求上的 requests_per_second 和 max_docs 之类的参数按比例分配给每个子请求。将此与上面有关分布不均匀的观点相结合，你应该得出结论，将 max_docs 与 slices 一起使用可能不会导致重新索引正好 max_docs 个文档。
每个子请求都会获得稍微不同的源快照，尽管这些快照都是在大约同一时间拍摄的。

选择切片数

编辑

如果自动切片，将 slices 设置为 auto 将为大多数索引选择合理的数字。如果手动切片或以其他方式调整自动切片，请使用以下准则。

当 slices 的数量等于索引中的分片数时，查询性能最有效。如果该数字很大（例如 500），请选择较小的数字，因为过多的 slices 会损害性能。将 slices 设置为高于分片数通常不会提高效率，并且会增加开销。

索引性能会随着切片数量线性扩展到可用资源。

查询性能还是索引性能在运行时中占主导地位取决于要重新索引的文档和集群资源。

重新索引路由

编辑

默认情况下，如果 _reindex 看到具有路由的文档，则除非脚本对其进行更改，否则会保留该路由。你可以在 dest 请求上设置 routing 以更改此行为

keep: 将每个匹配项发送的批量请求中的路由设置为匹配项上的路由。这是默认值。
discard: 将每个匹配项发送的批量请求上的路由设置为 null。
=<一些文本>: 将每个匹配项的批量请求的路由设置为 = 之后的所有文本。

例如，您可以使用以下请求将所有公司名称为 cat 的文档从 source 复制到 dest，并将路由设置为 cat。

$params = [
    'body' => [
        'source' => [
            'index' => 'source',
            'query' => [
                'match' => [
                    'company' => 'cat',
                ],
            ],
        ],
        'dest' => [
            'index' => 'dest',
            'routing' => '=cat',
        ],
    ],
];
$response = $client->reindex($params);

resp = client.reindex(
    source={
        "index": "source",
        "query": {
            "match": {
                "company": "cat"
            }
        }
    },
    dest={
        "index": "dest",
        "routing": "=cat"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'source',
      query: {
        match: {
          company: 'cat'
        }
      }
    },
    dest: {
      index: 'dest',
      routing: '=cat'
    }
  }
)
puts response

res, err := es.Reindex(
	strings.NewReader(`{
	  "source": {
	    "index": "source",
	    "query": {
	      "match": {
	        "company": "cat"
	      }
	    }
	  },
	  "dest": {
	    "index": "dest",
	    "routing": "=cat"
	  }
	}`))
fmt.Println(res, err)

const response = await client.reindex({
  source: {
    index: "source",
    query: {
      match: {
        company: "cat",
      },
    },
  },
  dest: {
    index: "dest",
    routing: "=cat",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "source",
    "query": {
      "match": {
        "company": "cat"
      }
    }
  },
  "dest": {
    "index": "dest",
    "routing": "=cat"
  }
}

Copy as curl Try in Elastic

默认情况下，_reindex 使用 1000 个滚动批次。您可以使用 source 元素中的 size 字段更改批次大小。

$params = [
    'body' => [
        'source' => [
            'index' => 'source',
            'size' => 100,
        ],
        'dest' => [
            'index' => 'dest',
            'routing' => '=cat',
        ],
    ],
];
$response = $client->reindex($params);

resp = client.reindex(
    source={
        "index": "source",
        "size": 100
    },
    dest={
        "index": "dest",
        "routing": "=cat"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'source',
      size: 100
    },
    dest: {
      index: 'dest',
      routing: '=cat'
    }
  }
)
puts response

res, err := es.Reindex(
	strings.NewReader(`{
	  "source": {
	    "index": "source",
	    "size": 100
	  },
	  "dest": {
	    "index": "dest",
	    "routing": "=cat"
	  }
	}`))
fmt.Println(res, err)

const response = await client.reindex({
  source: {
    index: "source",
    size: 100,
  },
  dest: {
    index: "dest",
    routing: "=cat",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "source",
    "size": 100
  },
  "dest": {
    "index": "dest",
    "routing": "=cat"
  }
}

Copy as curl Try in Elastic

使用 Ingest 管道重新索引

编辑

通过指定一个 pipeline，Reindex 还可以使用 Ingest 管道功能，如下所示

$params = [
    'body' => [
        'source' => [
            'index' => 'source',
        ],
        'dest' => [
            'index' => 'dest',
            'pipeline' => 'some_ingest_pipeline',
        ],
    ],
];
$response = $client->reindex($params);

resp = client.reindex(
    source={
        "index": "source"
    },
    dest={
        "index": "dest",
        "pipeline": "some_ingest_pipeline"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'source'
    },
    dest: {
      index: 'dest',
      pipeline: 'some_ingest_pipeline'
    }
  }
)
puts response

res, err := es.Reindex(
	strings.NewReader(`{
	  "source": {
	    "index": "source"
	  },
	  "dest": {
	    "index": "dest",
	    "pipeline": "some_ingest_pipeline"
	  }
	}`))
fmt.Println(res, err)

const response = await client.reindex({
  source: {
    index: "source",
  },
  dest: {
    index: "dest",
    pipeline: "some_ingest_pipeline",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "source"
  },
  "dest": {
    "index": "dest",
    "pipeline": "some_ingest_pipeline"
  }
}

Copy as curl Try in Elastic

查询参数

编辑

refresh

（可选，布尔值）如果为 true，则请求会刷新受影响的分片，以使此操作对搜索可见。默认为 false。

timeout

（可选，时间单位）每个索引等待以下操作的周期

默认为 1m（一分钟）。这保证了 Elasticsearch 在失败前至少等待超时时间。实际等待时间可能更长，尤其是在发生多次等待时。

wait_for_active_shards

（可选，字符串）在继续操作之前必须处于活动状态的每个分片的副本数。设置为 all 或任何非负整数，直到索引中每个分片的副本总数 (number_of_replicas+1)。默认为 1，表示仅等待每个主分片处于活动状态。

请参阅活动分片。

wait_for_completion

（可选，布尔值）如果为 true，则请求将阻塞，直到操作完成。默认为 true。

requests_per_second

（可选，整数）此请求的节流限制，以每秒子请求数为单位。默认为 -1（不节流）。

require_alias

（可选，布尔值）如果为 true，则目标必须是索引别名。默认为 false。

scroll

（可选，时间单位）指定应为滚动搜索维护索引一致视图的时长。

slices

（可选，整数）此任务应划分为的切片数。默认为 1，表示任务未切片为子任务。

max_docs

（可选，整数）要处理的最大文档数。默认为所有文档。当设置为小于或等于 scroll_size 的值时，将不会使用滚动来检索操作结果。

请求体

编辑

conflicts

（可选，枚举）设置为 proceed 可继续重新索引，即使存在冲突。默认为 abort。

max_docs

（可选，整数）要重新索引的最大文档数。如果冲突等于 proceed，则重新索引可能会尝试从源重新索引比 max_docs 更多的文档，直到它已成功将 max_docs 个文档索引到目标中，或者它已遍历源查询中的每个文档。

source

index

（必需，字符串）您要复制自其中的数据流、索引或别名的名称。也接受以逗号分隔的列表以从多个源重新索引。

query

（可选，查询对象）使用查询 DSL 指定要重新索引的文档。

remote

host: （可选，字符串）您要从中索引的 Elasticsearch 远程实例的 URL。从远程索引时必需。
username: （可选，字符串）用于与远程主机进行身份验证的用户名。
password: （可选，字符串）用于与远程主机进行身份验证的密码。
socket_timeout: （可选，时间单位）远程套接字读取超时。默认为 30 秒。
connect_timeout: （可选，时间单位）远程连接超时。默认为 30 秒。
headers: （可选，对象）包含请求标头的对象。

size

（可选，整数）每个批次要索引的文档数。从远程索引时使用，以确保批次适合堆上的缓冲区，该缓冲区默认为最大 100 MB。

slice

id: （可选，整数）用于手动切片的切片 ID。
max: （可选，整数）切片的总数。

sort

（可选，列表）以逗号分隔的 <field>:<direction> 对列表，用于在索引前进行排序。与 max_docs 结合使用，以控制重新索引的文档。

在 7.6 中已弃用。

重新索引中的排序已弃用。重新索引中的排序从未保证按顺序索引文档，并且会阻止重新索引的进一步开发，例如弹性性能改进。如果与 max_docs 结合使用，请考虑改用查询过滤器。

_source

（可选，字符串）如果为 true，则重新索引所有源字段。设置为列表以重新索引选定的字段。默认为 true。

dest

index: （必需，字符串）您要复制到其中的数据流、索引或索引别名的名称。
version_type: （可选，枚举）用于索引操作的版本控制。有效值：internal、external、external_gt、external_gte。有关详细信息，请参阅版本类型。
op_type: （可选，枚举）设置为 create 可仅索引尚不存在的文档（如果不存在则放入）。有效值：index、create。默认为 index。

要重新索引到数据流目标，此参数必须为 create。
pipeline: （可选，字符串）要使用的管道的名称。

script

source: （可选，字符串）在重新索引时运行以更新文档源或元数据的脚本。
lang: （可选，枚举）脚本语言：painless、expression、mustache、java。有关详细信息，请参阅脚本。

响应体

编辑

took: （整数）整个操作所花费的总毫秒数。
timed_out: （布尔值）如果重新索引期间执行的任何请求超时，则将此标志设置为 true。
total: （整数）已成功处理的文档数。
updated: （整数）已成功更新的文档数，即重新索引更新它之前已存在的具有相同 ID 的文档。
created: （整数）已成功创建的文档数。
deleted: （整数）已成功删除的文档数。
batches: （整数）重新索引拉回的滚动响应数。
noops: （整数）由于用于重新索引的脚本为 ctx.op 返回 noop 值而被忽略的文档数。
version_conflicts: （整数）重新索引命中的版本冲突数。
retries: （整数）重新索引尝试的重试次数。bulk 是重试的批量操作数，search 是重试的搜索操作数。
throttled_millis: （整数）请求为了符合 requests_per_second 而休眠的毫秒数。
requests_per_second: （整数）重新索引期间有效执行的每秒请求数。
throttled_until_millis: （整数）此字段在 _reindex 响应中应始终等于零。它仅在使用任务 API 时才有意义，它指示为了符合 requests_per_second，节流请求将再次执行的下一个时间（以自纪元以来的毫秒为单位）。
failures: （数组）如果在处理过程中出现任何无法恢复的错误，则为失败数组。如果此数组不为空，则由于这些失败，请求已中止。重新索引是使用批次实现的，任何失败都会导致整个过程中止，但当前批次中的所有失败都会收集到数组中。您可以使用 conflicts 选项来防止重新索引在版本冲突时中止。

示例

编辑

使用查询重新索引选定的文档

编辑

您可以通过向 source 添加查询来限制文档。例如，以下请求仅将 user.id 为 kimchy 的文档复制到 my-new-index-000001

resp = client.reindex(
    source={
        "index": "my-index-000001",
        "query": {
            "term": {
                "user.id": "kimchy"
            }
        }
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'my-index-000001',
      query: {
        term: {
          'user.id' => 'kimchy'
        }
      }
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    index: "my-index-000001",
    query: {
      term: {
        "user.id": "kimchy",
      },
    },
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "my-index-000001",
    "query": {
      "term": {
        "user.id": "kimchy"
      }
    }
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

使用 `max_docs` 重新索引选定的文档

编辑

您可以通过设置 max_docs 来限制处理的文档数。例如，此请求将单个文档从 my-index-000001 复制到 my-new-index-000001

resp = client.reindex(
    max_docs=1,
    source={
        "index": "my-index-000001"
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  body: {
    max_docs: 1,
    source: {
      index: 'my-index-000001'
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  max_docs: 1,
  source: {
    index: "my-index-000001",
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex
{
  "max_docs": 1,
  "source": {
    "index": "my-index-000001"
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

从多个源重新索引

编辑

source 中的 index 属性可以是列表，允许您在一个请求中从多个源复制。这将从 my-index-000001 和 my-index-000002 索引复制文档

resp = client.reindex(
    source={
        "index": [
            "my-index-000001",
            "my-index-000002"
        ]
    },
    dest={
        "index": "my-new-index-000002"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: [
        'my-index-000001',
        'my-index-000002'
      ]
    },
    dest: {
      index: 'my-new-index-000002'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    index: ["my-index-000001", "my-index-000002"],
  },
  dest: {
    index: "my-new-index-000002",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": ["my-index-000001", "my-index-000002"]
  },
  "dest": {
    "index": "my-new-index-000002"
  }
}

Copy as curl Try in Elastic

Reindex API 不会尽力处理 ID 冲突，因此最后写入的文档将“获胜”，但顺序通常是不可预测的，因此依赖此行为不是一个好主意。相反，请确保使用脚本使 ID 唯一。

使用源过滤器重新索引选定的字段

编辑

您可以使用源筛选来重新索引原始文档中的字段子集。例如，以下请求仅重新索引每个文档的 user.id 和 _doc 字段

resp = client.reindex(
    source={
        "index": "my-index-000001",
        "_source": [
            "user.id",
            "_doc"
        ]
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'my-index-000001',
      _source: [
        'user.id',
        '_doc'
      ]
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    index: "my-index-000001",
    _source: ["user.id", "_doc"],
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "my-index-000001",
    "_source": ["user.id", "_doc"]
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

重新索引以更改字段的名称

编辑

_reindex 可用于构建具有重命名字段的索引副本。假设您创建了一个索引，其中包含如下所示的文档

resp = client.index(
    index="my-index-000001",
    id="1",
    refresh=True,
    document={
        "text": "words words",
        "flag": "foo"
    },
)
print(resp)

response = client.index(
  index: 'my-index-000001',
  id: 1,
  refresh: true,
  body: {
    text: 'words words',
    flag: 'foo'
  }
)
puts response

const response = await client.index({
  index: "my-index-000001",
  id: 1,
  refresh: "true",
  document: {
    text: "words words",
    flag: "foo",
  },
});
console.log(response);

POST my-index-000001/_doc/1?refresh
{
  "text": "words words",
  "flag": "foo"
}

Copy as curl Try in Elastic

但您不喜欢名称 flag，并且希望将其替换为 tag。_reindex 可以为您创建另一个索引

resp = client.reindex(
    source={
        "index": "my-index-000001"
    },
    dest={
        "index": "my-new-index-000001"
    },
    script={
        "source": "ctx._source.tag = ctx._source.remove(\"flag\")"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'my-index-000001'
    },
    dest: {
      index: 'my-new-index-000001'
    },
    script: {
      source: 'ctx._source.tag = ctx._source.remove("flag")'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    index: "my-index-000001",
  },
  dest: {
    index: "my-new-index-000001",
  },
  script: {
    source: 'ctx._source.tag = ctx._source.remove("flag")',
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "my-index-000001"
  },
  "dest": {
    "index": "my-new-index-000001"
  },
  "script": {
    "source": "ctx._source.tag = ctx._source.remove(\"flag\")"
  }
}

Copy as curl Try in Elastic

现在您可以获取新文档

resp = client.get(
    index="my-new-index-000001",
    id="1",
)
print(resp)

response = client.get(
  index: 'my-new-index-000001',
  id: 1
)
puts response

const response = await client.get({
  index: "my-new-index-000001",
  id: 1,
});
console.log(response);

GET my-new-index-000001/_doc/1

Copy as curl Try in Elastic

这将返回

{
  "found": true,
  "_id": "1",
  "_index": "my-new-index-000001",
  "_version": 1,
  "_seq_no": 44,
  "_primary_term": 1,
  "_source": {
    "text": "words words",
    "tag": "foo"
  }
}

重新索引每日索引

编辑

您可以将 _reindex 与 Painless 结合使用，以重新索引每日索引，从而将新模板应用于现有文档。

假设您的索引包含如下所示的文档

$params = [
    'index' => 'metricbeat-2016.05.30',
    'id' => '1',
    'body' => [
        'system.cpu.idle.pct' => 0.908,
    ],
];
$response = $client->index($params);
$params = [
    'index' => 'metricbeat-2016.05.31',
    'id' => '1',
    'body' => [
        'system.cpu.idle.pct' => 0.105,
    ],
];
$response = $client->index($params);

resp = client.index(
    index="metricbeat-2016.05.30",
    id="1",
    refresh=True,
    document={
        "system.cpu.idle.pct": 0.908
    },
)
print(resp)

resp1 = client.index(
    index="metricbeat-2016.05.31",
    id="1",
    refresh=True,
    document={
        "system.cpu.idle.pct": 0.105
    },
)
print(resp1)

response = client.index(
  index: 'metricbeat-2016.05.30',
  id: 1,
  refresh: true,
  body: {
    'system.cpu.idle.pct' => 0.908
  }
)
puts response

response = client.index(
  index: 'metricbeat-2016.05.31',
  id: 1,
  refresh: true,
  body: {
    'system.cpu.idle.pct' => 0.105
  }
)
puts response

{
	res, err := es.Index(
		"metricbeat-2016.05.30",
		strings.NewReader(`{
	  "system.cpu.idle.pct": 0.908
	}`),
		es.Index.WithDocumentID("1"),
		es.Index.WithRefresh("true"),
		es.Index.WithPretty(),
	)
	fmt.Println(res, err)
}

{
	res, err := es.Index(
		"metricbeat-2016.05.31",
		strings.NewReader(`{
	  "system.cpu.idle.pct": 0.105
	}`),
		es.Index.WithDocumentID("1"),
		es.Index.WithRefresh("true"),
		es.Index.WithPretty(),
	)
	fmt.Println(res, err)
}

const response = await client.index({
  index: "metricbeat-2016.05.30",
  id: 1,
  refresh: "true",
  document: {
    "system.cpu.idle.pct": 0.908,
  },
});
console.log(response);

const response1 = await client.index({
  index: "metricbeat-2016.05.31",
  id: 1,
  refresh: "true",
  document: {
    "system.cpu.idle.pct": 0.105,
  },
});
console.log(response1);

PUT metricbeat-2016.05.30/_doc/1?refresh
{"system.cpu.idle.pct": 0.908}
PUT metricbeat-2016.05.31/_doc/1?refresh
{"system.cpu.idle.pct": 0.105}

Copy as curl Try in Elastic

metricbeat-* 索引的新模板已加载到 Elasticsearch 中，但它仅适用于新创建的索引。Painless 可用于重新索引现有文档并应用新模板。

以下脚本从索引名称中提取日期，并创建一个附加了 -1 的新索引。所有来自 metricbeat-2016.05.31 的数据都将被重新索引到 metricbeat-2016.05.31-1 中。

$params = [
    'body' => [
        'source' => [
            'index' => 'metricbeat-*',
        ],
        'dest' => [
            'index' => 'metricbeat',
        ],
        'script' => [
            'lang' => 'painless',
            'source' => 'ctx._index = \'metricbeat-\' + (ctx._index.substring(\'metricbeat-\'.length(), ctx._index.length())) + \'-1\'',
        ],
    ],
];
$response = $client->reindex($params);

resp = client.reindex(
    source={
        "index": "metricbeat-*"
    },
    dest={
        "index": "metricbeat"
    },
    script={
        "lang": "painless",
        "source": "ctx._index = 'metricbeat-' + (ctx._index.substring('metricbeat-'.length(), ctx._index.length())) + '-1'"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'metricbeat-*'
    },
    dest: {
      index: 'metricbeat'
    },
    script: {
      lang: 'painless',
      source: "ctx._index = 'metricbeat-' + (ctx._index.substring('metricbeat-'.length(), ctx._index.length())) + '-1'"
    }
  }
)
puts response

res, err := es.Reindex(
	strings.NewReader(`{
	  "source": {
	    "index": "metricbeat-*"
	  },
	  "dest": {
	    "index": "metricbeat"
	  },
	  "script": {
	    "lang": "painless",
	    "source": "ctx._index = 'metricbeat-' + (ctx._index.substring('metricbeat-'.length(), ctx._index.length())) + '-1'"
	  }
	}`))
fmt.Println(res, err)

const response = await client.reindex({
  source: {
    index: "metricbeat-*",
  },
  dest: {
    index: "metricbeat",
  },
  script: {
    lang: "painless",
    source:
      "ctx._index = 'metricbeat-' + (ctx._index.substring('metricbeat-'.length(), ctx._index.length())) + '-1'",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "metricbeat-*"
  },
  "dest": {
    "index": "metricbeat"
  },
  "script": {
    "lang": "painless",
    "source": "ctx._index = 'metricbeat-' + (ctx._index.substring('metricbeat-'.length(), ctx._index.length())) + '-1'"
  }
}

Copy as curl Try in Elastic

现在可以在 *-1 索引中找到之前 metricbeat 索引中的所有文档。

$params = [
    'index' => 'metricbeat-2016.05.30-1',
    'id' => '1',
];
$response = $client->get($params);
$params = [
    'index' => 'metricbeat-2016.05.31-1',
    'id' => '1',
];
$response = $client->get($params);

resp = client.get(
    index="metricbeat-2016.05.30-1",
    id="1",
)
print(resp)

resp1 = client.get(
    index="metricbeat-2016.05.31-1",
    id="1",
)
print(resp1)

response = client.get(
  index: 'metricbeat-2016.05.30-1',
  id: 1
)
puts response

response = client.get(
  index: 'metricbeat-2016.05.31-1',
  id: 1
)
puts response

{
	res, err := es.Get("metricbeat-2016.05.30-1", "1", es.Get.WithPretty())
	fmt.Println(res, err)
}

{
	res, err := es.Get("metricbeat-2016.05.31-1", "1", es.Get.WithPretty())
	fmt.Println(res, err)
}

const response = await client.get({
  index: "metricbeat-2016.05.30-1",
  id: 1,
});
console.log(response);

const response1 = await client.get({
  index: "metricbeat-2016.05.31-1",
  id: 1,
});
console.log(response1);

GET metricbeat-2016.05.30-1/_doc/1
GET metricbeat-2016.05.31-1/_doc/1

Copy as curl Try in Elastic

先前的方法还可以与更改字段名称结合使用，以仅将现有数据加载到新索引中，并根据需要重命名字段。

提取源的随机子集

编辑

_reindex 可以用来提取源的随机子集以进行测试。

resp = client.reindex(
    max_docs=10,
    source={
        "index": "my-index-000001",
        "query": {
            "function_score": {
                "random_score": {},
                "min_score": 0.9
            }
        }
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  body: {
    max_docs: 10,
    source: {
      index: 'my-index-000001',
      query: {
        function_score: {
          random_score: {},
          min_score: 0.9
        }
      }
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  max_docs: 10,
  source: {
    index: "my-index-000001",
    query: {
      function_score: {
        random_score: {},
        min_score: 0.9,
      },
    },
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex
{
  "max_docs": 10,
  "source": {
    "index": "my-index-000001",
    "query": {
      "function_score" : {
        "random_score" : {},
        "min_score" : 0.9    
      }
    }
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

您可能需要根据从源中提取的相对数据量来调整 min_score。

在重新索引期间修改文档

编辑

与 _update_by_query 类似，_reindex 支持修改文档的脚本。与 _update_by_query 不同，该脚本允许修改文档的元数据。此示例会增加源文档的版本。

resp = client.reindex(
    source={
        "index": "my-index-000001"
    },
    dest={
        "index": "my-new-index-000001",
        "version_type": "external"
    },
    script={
        "source": "if (ctx._source.foo == 'bar') {ctx._version++; ctx._source.remove('foo')}",
        "lang": "painless"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      index: 'my-index-000001'
    },
    dest: {
      index: 'my-new-index-000001',
      version_type: 'external'
    },
    script: {
      source: "if (ctx._source.foo == 'bar') {ctx._version++; ctx._source.remove('foo')}",
      lang: 'painless'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    index: "my-index-000001",
  },
  dest: {
    index: "my-new-index-000001",
    version_type: "external",
  },
  script: {
    source:
      "if (ctx._source.foo == 'bar') {ctx._version++; ctx._source.remove('foo')}",
    lang: "painless",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "index": "my-index-000001"
  },
  "dest": {
    "index": "my-new-index-000001",
    "version_type": "external"
  },
  "script": {
    "source": "if (ctx._source.foo == 'bar') {ctx._version++; ctx._source.remove('foo')}",
    "lang": "painless"
  }
}

Copy as curl Try in Elastic

就像在 _update_by_query 中一样，您可以设置 ctx.op 来更改在目标上执行的操作。

noop: 如果您的脚本确定文档不必在目标中索引，则设置 ctx.op = "noop"。此空操作将在响应正文中的 noop 计数器中报告。
删除: 如果您的脚本确定必须从目标中删除文档，则设置 ctx.op = "delete"。删除将在响应正文中的 deleted 计数器中报告。

将 ctx.op 设置为其他任何值将返回错误，设置 ctx 中的任何其他字段也会返回错误。

想想这些可能性！请务必小心；您可以更改

_id
_index
_version
_routing

将 _version 设置为 null 或从 ctx 映射中清除它，就像在索引请求中不发送版本一样；这将导致文档在目标中被覆盖，而无论目标上的版本或您在 _reindex 请求中使用的版本类型。

从远程重新索引

编辑

重新索引支持从远程 Elasticsearch 集群重新索引

resp = client.reindex(
    source={
        "remote": {
            "host": "http://otherhost:9200",
            "username": "user",
            "password": "pass"
        },
        "index": "my-index-000001",
        "query": {
            "match": {
                "test": "data"
            }
        }
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      remote: {
        host: 'http://otherhost:9200',
        username: 'user',
        password: 'pass'
      },
      index: 'my-index-000001',
      query: {
        match: {
          test: 'data'
        }
      }
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    remote: {
      host: "http://otherhost:9200",
      username: "user",
      password: "pass",
    },
    index: "my-index-000001",
    query: {
      match: {
        test: "data",
      },
    },
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "remote": {
      "host": "http://otherhost:9200",
      "username": "user",
      "password": "pass"
    },
    "index": "my-index-000001",
    "query": {
      "match": {
        "test": "data"
      }
    }
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

host 参数必须包含方案、主机、端口（例如 https://otherhost:9200）和可选路径（例如 https://otherhost:9200/proxy）。username 和 password 参数是可选的，当它们存在时，_reindex 将使用基本身份验证连接到远程 Elasticsearch 节点。使用基本身份验证时，请务必使用 https，否则密码将以纯文本形式发送。有一系列的设置可用于配置 https 连接的行为。

使用 Elastic Cloud 时，也可以通过使用有效的 API 密钥对远程集群进行身份验证。

resp = client.reindex(
    source={
        "remote": {
            "host": "http://otherhost:9200",
            "headers": {
                "Authorization": "ApiKey API_KEY_VALUE"
            }
        },
        "index": "my-index-000001",
        "query": {
            "match": {
                "test": "data"
            }
        }
    },
    dest={
        "index": "my-new-index-000001"
    },
)
print(resp)

response = client.reindex(
  body: {
    source: {
      remote: {
        host: 'http://otherhost:9200',
        headers: {
          "Authorization": 'ApiKey API_KEY_VALUE'
        }
      },
      index: 'my-index-000001',
      query: {
        match: {
          test: 'data'
        }
      }
    },
    dest: {
      index: 'my-new-index-000001'
    }
  }
)
puts response

const response = await client.reindex({
  source: {
    remote: {
      host: "http://otherhost:9200",
      headers: {
        Authorization: "ApiKey API_KEY_VALUE",
      },
    },
    index: "my-index-000001",
    query: {
      match: {
        test: "data",
      },
    },
  },
  dest: {
    index: "my-new-index-000001",
  },
});
console.log(response);

POST _reindex
{
  "source": {
    "remote": {
      "host": "http://otherhost:9200",
      "headers": {
        "Authorization": "ApiKey API_KEY_VALUE"
      }
    },
    "index": "my-index-000001",
    "query": {
      "match": {
        "test": "data"
      }
    }
  },
  "dest": {
    "index": "my-new-index-000001"
  }
}

Copy as curl Try in Elastic

必须在 elasticsearch.yml 中使用 reindex.remote.whitelist 属性显式允许远程主机。它可以设置为允许的远程 host 和 port 组合的逗号分隔列表。忽略方案，仅使用主机和端口。例如

reindex.remote.whitelist: [otherhost:9200, another:9200, 127.0.10.*:9200, localhost:*"]

必须在任何将协调重新索引的节点上配置允许的主机列表。

此功能应适用于您可能找到的任何版本的 Elasticsearch 远程集群。这应该允许您通过从旧版本的集群重新索引来将任何版本的 Elasticsearch 升级到当前版本。

Elasticsearch 不支持跨主要版本的前向兼容性。例如，您不能从 7.x 集群重新索引到 6.x 集群。

为了启用发送到旧版本 Elasticsearch 的查询，query 参数将直接发送到远程主机，而无需验证或修改。

从远程集群重新索引不支持手动或自动切片。

从远程服务器重新索引使用一个默认最大大小为 100MB 的堆上缓冲区。如果远程索引包含非常大的文档，则需要使用较小的批处理大小。下面的示例将批处理大小设置为 10，这是非常小的。

POST _reindex
{
  "source": {
    "remote": {
      "host": "http://otherhost:9200",
      ...
    },
    "index": "source",
    "size": 10,
    "query": {
      "match": {
        "test": "data"
      }
    }
  },
  "dest": {
    "index": "dest"
  }
}

Copy as curl Try in Elastic

也可以使用 socket_timeout 字段设置远程连接上的套接字读取超时，并使用 connect_timeout 字段设置连接超时。两者默认都为 30 秒。此示例将套接字读取超时设置为一分钟，将连接超时设置为 10 秒。

POST _reindex
{
  "source": {
    "remote": {
      "host": "http://otherhost:9200",
      ...,
      "socket_timeout": "1m",
      "connect_timeout": "10s"
    },
    "index": "source",
    "query": {
      "match": {
        "test": "data"
      }
    }
  },
  "dest": {
    "index": "dest"
  }
}

Copy as curl Try in Elastic

配置 SSL 参数

编辑

从远程重新索引支持可配置的 SSL 设置。这些必须在 elasticsearch.yml 文件中指定，安全设置除外，安全设置是在 Elasticsearch 密钥库中添加的。无法在 _reindex 请求的正文中配置 SSL。

支持以下设置

reindex.ssl.certificate_authorities: 应信任的 PEM 编码证书文件的路径列表。您不能同时指定 reindex.ssl.certificate_authorities 和 reindex.ssl.truststore.path。
reindex.ssl.truststore.path: 包含要信任的证书的 Java 密钥库文件的路径。此密钥库可以是“JKS”或“PKCS#12”格式。您不能同时指定 reindex.ssl.certificate_authorities 和 reindex.ssl.truststore.path。
reindex.ssl.truststore.password: 密钥库 (reindex.ssl.truststore.path) 的密码。 [7.17.0] 在 7.17.0 中已弃用。请优先使用 reindex.ssl.truststore.secure_password。此设置不能与 reindex.ssl.truststore.secure_password 一起使用。
reindex.ssl.truststore.secure_password (安全): 密钥库 (reindex.ssl.truststore.path) 的密码。此设置不能与 reindex.ssl.truststore.password 一起使用。
reindex.ssl.truststore.type: 密钥库 (reindex.ssl.truststore.path) 的类型。必须为 jks 或 PKCS12。如果密钥库路径以“.p12”、“.pfx”或“pkcs12”结尾，则此设置默认为 PKCS12。否则，它默认为 jks。
reindex.ssl.verification_mode: 指示用于防止中间人攻击和证书伪造的验证类型。可以是 full（验证主机名和证书路径）、certificate（验证证书路径，但不验证主机名）或 none（不执行任何验证 - 强烈建议不要在生产环境中使用）。默认为 full。
reindex.ssl.certificate: 指定用于 HTTP 客户端身份验证的 PEM 编码证书（或证书链）的路径（如果远程集群需要）。此设置要求还设置 reindex.ssl.key。您不能同时指定 reindex.ssl.certificate 和 reindex.ssl.keystore.path。
reindex.ssl.key: 指定与用于客户端身份验证的证书关联的 PEM 编码私钥的路径(reindex.ssl.certificate)。您不能同时指定 reindex.ssl.key 和 reindex.ssl.keystore.path。
reindex.ssl.key_passphrase: 指定用于解密 PEM 编码私钥 (reindex.ssl.key) 的密码（如果已加密）。 [7.17.0] 在 7.17.0 中已弃用。请优先使用 reindex.ssl.secure_key_passphrase。不能与 reindex.ssl.secure_key_passphrase 一起使用。
reindex.ssl.secure_key_passphrase (安全): 指定用于解密 PEM 编码私钥 (reindex.ssl.key) 的密码（如果已加密）。不能与 reindex.ssl.key_passphrase 一起使用。
reindex.ssl.keystore.path: 指定密钥库的路径，该密钥库包含用于 HTTP 客户端身份验证的私钥和证书（如果远程集群需要）。此密钥库可以是“JKS”或“PKCS#12”格式。您不能同时指定 reindex.ssl.key 和 reindex.ssl.keystore.path。
reindex.ssl.keystore.type: 密钥库 (reindex.ssl.keystore.path) 的类型。必须为 jks 或 PKCS12。如果密钥库路径以“.p12”、“.pfx”或“pkcs12”结尾，则此设置默认为 PKCS12。否则，它默认为 jks。
reindex.ssl.keystore.password: 密钥库 (reindex.ssl.keystore.path) 的密码。 [7.17.0] 在 7.17.0 中已弃用。请优先使用 reindex.ssl.keystore.secure_password。此设置不能与 reindex.ssl.keystore.secure_password 一起使用。
reindex.ssl.keystore.secure_password (安全): 密钥库 (reindex.ssl.keystore.path) 的密码。此设置不能与 reindex.ssl.keystore.password 一起使用。
reindex.ssl.keystore.key_password: 密钥库 (reindex.ssl.keystore.path) 中密钥的密码。默认为密钥库密码。 [7.17.0] 在 7.17.0 中已弃用。请优先使用 reindex.ssl.keystore.secure_key_password。此设置不能与 reindex.ssl.keystore.secure_key_password 一起使用。
reindex.ssl.keystore.secure_key_password (安全): 密钥库 (reindex.ssl.keystore.path) 中密钥的密码。默认为密钥库密码。此设置不能与 reindex.ssl.keystore.key_password 一起使用。

« Bulk API Term vectors API »

Was this helpful?

Feedback

The Search AI Company

Generative AI

Search

Security

Observability

By solution

Industries

Reindex API

Reindex API

请求

前提条件

描述

异步运行重新索引

从多个源重新索引

节流

重新节流

切片

手动切片

自动切片

选择切片数

重新索引路由

使用 Ingest 管道重新索引

查询参数

请求体

响应体

示例

使用查询重新索引选定的文档

使用 max_docs 重新索引选定的文档

从多个源重新索引

使用源过滤器重新索引选定的字段

重新索引以更改字段的名称

重新索引每日索引

提取源的随机子集

在重新索引期间修改文档

从远程重新索引

配置 SSL 参数

Follow us

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards

使用 `max_docs` 重新索引选定的文档