Elasticsearch 指南其他版本
8.17 中的新功能
Elasticsearch 基础
- 什么是 Elasticsearch?
- 运行 Elasticsearch
- 索引和文档
- 向 Elasticsearch 添加数据
- 搜索和分析数据
- 为生产环境做好准备
快速入门
- 基础：使用 API 进行索引和搜索
- 基础：全文搜索和过滤
- 基础：使用聚合分析电子商务数据
设置 Elasticsearch
- 在本地运行 Elasticsearch
- 安装 Elasticsearch
- 配置 Elasticsearch
- 重要的系统配置
- 引导检查
- X-Pack 的引导检查
- 启动 Elasticsearch
- 停止 Elasticsearch
- 发现和集群形成
- 在集群中添加和删除节点
- 完整集群重启和滚动重启
- 远程集群
- 插件
升级 Elasticsearch
- 已存档设置
- 从较旧的 Elasticsearch 版本读取索引
索引模块
- 分析
- 索引分片分配
- 索引块
- 映射器
- 合并
- 相似度模块
- 慢日志
- 存储
  - 将数据预加载到文件系统缓存中
- 事务日志
- 历史记录保留
- 索引排序
  - 使用索引排序来加速 conjunctions
- 索引压力
映射
- 动态映射
  - 动态字段映射
  - 动态模板
- 显式映射
- 运行时字段
- 字段数据类型
  - 聚合度量
  - 别名
  - 数组
  - 二进制
  - 布尔值
  - 完成
  - 日期
  - 日期纳秒
  - 密集向量
  - 扁平化
  - 地理点
  - 地理形状
  - 直方图
  - IP
  - 连接
  - 关键词
  - 嵌套
  - 数值
  - 对象
  - 传递对象
  - 过滤器
  - 点
  - 范围
  - 排名特征
  - 排名特征
  - 即时搜索
  - 语义文本
  - 形状
  - 稀疏向量
  - 文本
  - 令牌计数
  - 无符号长整型
  - 版本
- 元数据字段
- 映射参数
- 映射限制设置
- 删除映射类型
文本分析
- 概述
- 概念
- 配置文本分析
- 内置分析器参考
  - 指纹
  - 关键词
  - 语言
  - 模式
  - 简单
  - 标准
  - 停止
  - 空格
- 分词器参考
  - 字符组
  - 经典
  - 边缘 N 元
  - 关键词
  - 字母
  - 小写
  - N 元
  - 路径层次结构
  - 模式
  - 简单模式
  - 简单模式分割
  - 标准
  - 泰语
  - UAX URL 电子邮件
  - 空格
- 令牌过滤器参考
  - 省略号
  - ASCII 折叠
  - CJK 双字母
  - CJK 宽度
  - 经典
  - 常用语法
  - 条件
  - 十进制数字
  - 分隔的有效负载
  - 字典复合器
  - 边缘 N 元
  - 省略
  - 指纹
  - 扁平图
  - Hunspell
  - 连字符复合器
  - 保留类型
  - 保留单词
  - 关键字标记
  - 关键字重复
  - KStem
  - 长度
  - 限制令牌计数
  - 小写
  - MinHash
  - 多路复用器
  - N 元
  - 规范化
  - 模式捕获
  - 模式替换
  - 语音
  - Porter 词干
  - 谓词脚本
  - 删除重复项
  - 反转
  - 瓦片
  - 雪球
  - 词干分析器
  - 词干分析器覆盖
  - 停止
  - 同义词
  - 同义词图
  - 修剪
  - 截断
  - 唯一
  - 大写
  - 单词分隔符
  - 单词分隔符图
- 字符过滤器参考
- 规范化器
索引模板
- 模拟多组件模板
- 配置 ignore_missing_component_templates
  - 使用示例
数据流
- 设置数据流
- 使用数据流
- 修改数据流
- 时间序列数据流 (TSDS)
- 日志数据流
- 数据流生命周期
摄取管道
- 示例：解析日志
- 丰富您的数据
- 处理器参考
  - 附加
  - 附件
  - 字节
  - 圆
  - 社区 ID
  - 转换
  - CSV
  - 日期
  - 日期索引名称
  - 剖析
  - 点扩展器
  - 丢弃
  - 丰富
  - 失败
  - 指纹
  - 循环
  - 地理网格
  - GeoIP
  - Grok
  - Gsub
  - HTML 条
  - 推理
  - IP 位置
  - 连接
  - JSON
  - KV
  - 小写
  - 网络方向
  - 管道
  - 编辑
  - 注册域
  - 删除
  - 重命名
  - 重新路由
  - 脚本
  - 设置
  - 设置安全用户
  - 排序
  - 拆分
  - 终止
  - 修剪
  - 大写
  - URL 解码
  - URI 部分
  - 用户代理
- 搜索中的摄取管道
  - 推理处理
  - NLP 教程
别名
搜索您的数据
- 搜索 API
- 搜索相关性优化
- 检索器
  - 检索器示例
- kNN 搜索
- 语义搜索
- 跨集群搜索
- 使用同义词搜索
- 搜索应用程序
- 搜索分析
重新排名
- 语义重新排名
- 学习排名
  - 部署和管理 LTR 模型
  - 使用 LTR 进行搜索
查询 DSL
- 查询和过滤器上下文
- 复合查询
- 全文查询
- 地理位置查询
- 形状查询
  - 形状
- 连接查询
  - 嵌套
  - 有子级
  - 有父级
  - 父级 ID
- 匹配所有
- 跨度查询
- 向量查询
  - Knn
  - 稀疏向量
  - 语义
  - 文本扩展
  - 加权标记
- 专用查询
  - 距离特征
  - 更像这样
  - 渗透
  - 排名特征
  - 脚本
  - 脚本评分
  - 包装器
  - 固定查询
  - 规则
- 词项级查询
  - 存在
  - 模糊
  - ID
  - 前缀
  - 范围
  - 正则表达式
  - 词项
  - 词项集
  - 词项集
  - 通配符
- minimum_should_match 参数
- rewrite 参数
- 正则表达式语法
聚合
- 桶聚合
- 指标聚合
- 管道聚合
地理空间分析
连接器
- 连接器引用
  - Azure Blob 存储
  - Box
  - Confluence
  - Dropbox
  - GitHub
  - Gmail
  - Google Cloud Storage
  - Google Drive
  - GraphQL
  - Jira
  - Microsoft SQL
  - MongoDB
  - MySQL
  - 网络驱动器
  - Notion
  - OneDrive
  - OpenText Documentum
  - Oracle
  - Outlook
  - PostgreSQL
  - Redis
  - S3
  - Salesforce
  - ServiceNow
  - SharePoint Online
  - SharePoint Server
  - Slack
  - Teams
  - Zoom
- 自管理连接器
- Elastic 管理的连接器
  - 管理连接器教程 (MongoDB)
- 构建和自定义连接器
- Kibana 中的连接器 UI
- 连接器 API
  - API 教程
- 内容同步
- 提取和转换
  - 内容提取
  - 同步规则
- 文档级安全性
  - DLS 的工作原理
  - 搜索应用程序中的 DLS
- 管理主题
- 用例
  - 内部知识搜索
- 发行说明
- 已知问题
EQL
- 语法参考
- 函数参考
- 管道参考
- 示例：使用 EQL 检测威胁
ES|QL
- 入门
- ES|QL 参考
- 使用 ES|QL
- 限制
- 示例
SQL
- 概述
- SQL 入门
- 约定和术语
  - 跨 SQL 和 Elasticsearch 的映射概念
- 安全
- SQL REST API
- SQL 转换 API
- SQL CLI
- SQL JDBC
  - API 用法
- SQL ODBC
  - 驱动程序安装
  - 配置
- SQL 客户端应用程序
- SQL 语言
- 函数和运算符
- 保留关键字
- SQL 限制
脚本
- Painless 脚本语言
- 如何编写脚本
- 访问文档中的字段
- 常见脚本用例
  - 字段提取
- 访问文档字段和特殊变量
- 脚本和安全性
- Lucene 表达式语言
- 使用脚本引擎的高级脚本
数据管理
- ILM：管理索引生命周期
- 教程：自定义内置策略
- 教程：自动翻转
- Kibana 中的索引管理
- 概述
- 概念
- 索引生命周期操作
  - 分配
  - 删除
  - 强制合并
  - 迁移
  - 只读
  - 翻转
  - 降采样
  - 可搜索快照
  - 设置优先级
  - 收缩
  - 取消关注
  - 等待快照
- 配置生命周期策略
- 将索引分配过滤器迁移到节点角色
- 解决索引生命周期管理错误
- 启动和停止索引生命周期管理
- 管理现有索引
- 跳过翻转
- 还原托管数据流或索引
- 数据层
自动缩放
- 自动缩放决策器
监视集群
- 概述
- 工作原理
- 在生产环境中监视
- 使用 Elastic Agent 收集监视数据
- 使用 Metricbeat 收集监视数据
- 使用 Filebeat 收集日志数据
- 配置用于监视的数据流/索引
- 旧版收集方法
汇总或转换数据
- 汇总历史数据
- 转换数据
设置高可用性集群
- 弹性设计
  - 小型集群中的弹性
  - 大型集群中的弹性
- 跨集群复制
快照和还原
- 注册存储库
- 创建快照
- 还原快照
- 可搜索快照
保护 Elastic Stack 的安全
- Elasticsearch 安全原则
- 自动启用安全性启动 Elastic Stack
- 手动配置安全性
- 更新节点安全证书
  - 使用相同的 CA
  - 使用不同的 CA
- 用户身份验证
- 用户授权
- 启用审计日志
- 使用 IP 过滤限制连接
- 保护客户端和集成
- 操作员权限
- 故障排除
- 限制
Watcher
- Watcher 入门
- Watcher 的工作原理
- 在 Watcher 中加密敏感数据
- 输入
- 触发器
  - 计划触发器
- 条件
- 操作
- 转换
- 管理监控
- 示例监控
  - 监控 Elasticsearch 集群的状态
- 限制
命令行工具
- elasticsearch-certgen
- elasticsearch-certutil
- elasticsearch-create-enrollment-token
- elasticsearch-croneval
- elasticsearch-keystore
- elasticsearch-node
- elasticsearch-reconfigure-node
- elasticsearch-reset-password
- elasticsearch-saml-metadata
- elasticsearch-service-tokens
- elasticsearch-setup-passwords
- elasticsearch-shard
- elasticsearch-syskeygen
- elasticsearch-users
优化
- 一般建议
- 调整索引速度
- 调整搜索速度
- 调整近似 kNN 搜索
- 调整磁盘使用量
- 调整分片大小
- 将 Elasticsearch 用于时间序列数据
故障排除
- 修复常见的集群问题
  - 水位错误
  - 断路器错误
  - 高 CPU 使用率
  - 高 JVM 内存压力
  - 红色或黄色集群健康状态
  - 拒绝的请求
  - 任务队列积压
  - 映射爆炸
  - 热点
- 诊断未分配的分片
- 向系统中添加丢失的层
- 允许 Elasticsearch 在系统中分配数据
- 允许 Elasticsearch 分配索引
- 索引将索引分配过滤器与数据层节点角色混合，以在数据层之间移动
- 没有足够的节点来分配所有分片副本
- 单个节点上索引的分片总数已超过
- 每个节点的分片总数已达到
- 故障排除损坏
- 修复磁盘空间不足的数据节点
  - 增加数据节点的磁盘容量
  - 减少数据节点的磁盘使用量
- 修复磁盘空间不足的主节点
- 修复磁盘空间不足的其他角色节点
- 启动索引生命周期管理
- 启动快照生命周期管理
- 从快照恢复
- 故障排除损坏的存储库
  - 诊断损坏的存储库
  - 诊断未知存储库
  - 诊断无效存储库
- 解决重复的快照策略失败问题
- 故障排除不稳定的集群
- 故障排除发现
- 故障排除监控
- 故障排除转换
- 故障排除 Watcher
- 故障排除搜索
- 故障排除分片容量健康问题
- 故障排除不平衡的集群
- 捕获诊断信息
REST API
- API 约定
- 通用选项
- REST API 兼容性
- 自动缩放 API
  - 创建或更新自动缩放策略
  - 获取自动缩放容量
  - 删除自动缩放策略
  - 获取自动缩放策略
- 行为分析 API
  - 放置分析集合
  - 删除分析集合
  - 列出分析集合
  - 发布分析集合事件
- 紧凑和对齐文本 (CAT) API
  - cat 别名
  - cat 分配
  - cat 异常检测器
  - cat 组件模板
  - cat 计数
  - cat 数据帧分析
  - cat 数据馈送
  - cat 字段数据
  - cat 健康
  - cat 索引
  - cat 主节点
  - cat 节点属性
  - cat 节点
  - cat 待处理任务
  - cat 插件
  - cat 恢复
  - cat 存储库
  - cat 段
  - cat 分片
  - cat 快照
  - cat 任务管理
  - cat 模板
  - cat 线程池
  - cat 训练模型
  - cat 转换
- 集群 API
  - 集群分配解释
  - 集群获取设置
  - 集群健康
  - 健康
  - 集群重新路由
  - 集群状态
  - 集群统计信息
  - 集群更新设置
  - 节点功能使用情况
  - 节点热线程
  - 节点信息
  - 预验证节点移除
  - 节点重新加载安全设置
  - 节点统计信息
  - 集群信息
  - 待处理的集群任务
  - 远程集群信息
  - 任务管理
  - 投票配置排除项
  - 创建或更新所需节点
  - 获取所需节点
  - 删除所需节点
  - 获取所需平衡
  - 重置所需平衡
- 跨集群复制 API
  - 获取 CCR 统计信息
  - 创建跟随者
  - 暂停跟随者
  - 恢复跟随者
  - 取消关注
  - 忘记跟随者
  - 获取跟随者统计信息
  - 获取跟随者信息
  - 创建自动跟随模式
  - 删除自动跟随模式
  - 获取自动跟随模式
  - 暂停自动跟随模式
  - 恢复自动跟随模式
- 连接器 API
  - 创建连接器
  - 删除连接器
  - 获取连接器
  - 列出连接器
  - 更新连接器 API 密钥 ID
  - 更新连接器配置
  - 更新连接器索引名称
  - 更新连接器功能
  - 更新连接器筛选
  - 更新连接器名称和描述
  - 更新连接器管道
  - 更新连接器调度
  - 更新连接器服务类型
  - 创建连接器同步作业
  - 取消连接器同步作业
  - 删除连接器同步作业
  - 获取连接器同步作业
  - 列出连接器同步作业
  - 检入连接器
  - 更新连接器错误
  - 更新连接器上次同步统计信息
  - 更新连接器状态
  - 检入连接器同步作业
  - 声明连接器同步作业
  - 设置连接器同步作业错误
  - 设置连接器同步作业统计信息
- 数据流 API
  - 创建数据流
  - 删除数据流
  - 获取数据流
  - 迁移到数据流
  - 数据流统计信息
  - 升级数据流
  - 修改数据流
  - 放置数据流生命周期
  - 获取数据流生命周期
  - 删除数据流生命周期
  - 解释数据流生命周期
  - 获取数据流生命周期
  - 降采样
- 文档 API
  - 读取和写入文档
  - 索引
  - 获取
  - 删除
  - 按查询删除
  - 更新
  - 按查询更新
  - 多重获取
  - 批量
  - 重新索引
  - 词条向量
  - 多词条向量
  - ?refresh
  - 乐观并发控制
- 丰富 API
  - 创建丰富策略
  - 删除丰富策略
  - 获取丰富策略
  - 执行丰富策略
  - 丰富统计信息
- EQL API
  - 删除异步 EQL 搜索
  - EQL 搜索
  - 获取异步 EQL 搜索
  - 获取异步 EQL 搜索状态
- ES|QL API
  - ES|QL 查询 API
  - ES|QL 异步查询 API
  - ES|QL 异步查询获取 API
  - ES|QL 异步查询删除 API
- 功能 API
  - 获取功能
  - 重置功能
- Fleet API
  - 获取全局检查点
  - Fleet 搜索
  - Fleet 多重搜索
- 图表探索 API
- 索引 API
  - 别名是否存在
  - 别名
  - 分析
  - 分析索引磁盘使用量
  - 清除缓存
  - 克隆索引
  - 关闭索引
  - 创建索引
  - 创建或更新别名
  - 创建或更新组件模板
  - 创建或更新索引模板
  - 创建或更新索引模板（旧版）
  - 删除组件模板
  - 删除悬挂索引
  - 删除别名
  - 删除索引
  - 删除索引模板
  - 删除索引模板（旧版）
  - 存在
  - 字段使用情况统计信息
  - 刷新
  - 强制合并
  - 获取别名
  - 获取组件模板
  - 获取字段映射
  - 获取索引
  - 获取索引设置
  - 获取索引模板
  - 获取索引模板（旧版）
  - 获取映射
  - 导入悬挂索引
  - 索引恢复
  - 索引段
  - 索引分片存储
  - 索引统计信息
  - 索引模板是否存在（旧版）
  - 列出悬挂索引
  - 打开索引
  - 刷新
  - 解析索引
  - 解析集群
  - 翻转
  - 收缩索引
  - 模拟索引
  - 模拟模板
  - 拆分索引
  - 解冻索引
  - 更新索引设置
  - 更新映射
- 索引生命周期管理 API
  - 创建或更新生命周期策略
  - 获取策略
  - 删除策略
  - 移动到步骤
  - 删除策略
  - 重试策略
  - 获取索引生命周期管理状态
  - 解释生命周期
  - 启动索引生命周期管理
  - 停止索引生命周期管理
  - 将索引、ILM 策略以及旧版、可组合和组件模板迁移到数据层路由
- 推理 API
  - 删除推理 API
  - 获取推理 API
  - 执行推理 API
  - 创建推理 API
  - 流式推理 API
  - 更新推理 API
  - 阿里云 AI 搜索推理服务
  - Amazon Bedrock 推理服务
  - Anthropic 推理服务
  - Azure AI Studio 推理服务
  - Azure OpenAI 推理服务
  - Cohere 推理服务
  - Elasticsearch 推理服务
  - ELSER 推理服务
  - Google AI Studio 推理服务
  - Google Vertex AI 推理服务
  - HuggingFace 推理服务
  - Mistral 推理服务
  - OpenAI 推理服务
  - Watsonx 推理服务
- 信息 API
- 摄取 API
  - 创建或更新管道
  - 获取管道
  - 删除管道
  - 模拟管道
  - 模拟摄取
  - GeoIP 统计
  - 创建或更新 IP 地理位置数据库配置
  - 获取 IP 地理位置数据库配置
  - 删除 IP 地理位置数据库配置
- 许可 API
  - 删除许可证
  - 获取许可证
  - 获取试用状态
  - 开始试用
  - 获取基本状态
  - 开始基本版
  - 更新许可证
- Logstash API
  - 创建或更新 Logstash 管道
  - 删除 Logstash 管道
  - 获取 Logstash 管道
- 机器学习 API
  - 获取机器学习信息
  - 获取机器学习内存统计
  - 设置升级模式
- 机器学习异常检测 API
  - 向日历添加事件
  - 向日历添加作业
  - 关闭作业
  - 创建作业
  - 创建日历
  - 创建数据源
  - 创建过滤器
  - 删除日历
  - 删除数据源
  - 从日历中删除事件
  - 删除过滤器
  - 删除预测
  - 删除作业
  - 从日历中删除作业
  - 删除模型快照
  - 删除过期数据
  - 估计模型内存
  - 刷新作业
  - 预测作业
  - 获取存储桶
  - 获取日历
  - 获取类别
  - 获取数据源
  - 获取数据源统计
  - 获取影响因素
  - 获取作业
  - 获取作业统计
  - 获取模型快照
  - 获取模型快照升级统计
  - 获取总体存储桶
  - 获取计划事件
  - 获取过滤器
  - 获取记录
  - 打开作业
  - 向作业发布数据
  - 预览数据源
  - 重置作业
  - 还原模型快照
  - 启动数据源
  - 停止数据源
  - 更新数据源
  - 更新过滤器
  - 更新作业
  - 更新模型快照
  - 升级模型快照
- 机器学习数据帧分析 API
  - 创建数据帧分析作业
  - 删除数据帧分析作业
  - 评估数据帧分析
  - 解释数据帧分析
  - 获取数据帧分析作业
  - 获取数据帧分析作业统计
  - 预览数据帧分析
  - 启动数据帧分析作业
  - 停止数据帧分析作业
  - 更新数据帧分析作业
- 机器学习训练模型 API
  - 清除训练模型部署缓存
  - 创建或更新训练模型别名
  - 创建训练模型的一部分
  - 创建训练模型
  - 创建训练模型词汇表
  - 删除训练模型别名
  - 删除训练模型
  - 获取训练模型
  - 获取训练模型统计
  - 推断训练模型
  - 启动训练模型部署
  - 停止训练模型部署
  - 更新训练模型部署
- 迁移 API
  - 弃用信息
  - 功能迁移
- 节点生命周期 API
  - 放置关闭 API
  - 获取关闭 API
  - 删除关闭 API
- 查询规则 API
  - 创建或更新查询规则集
  - 获取查询规则集
  - 列出查询规则集
  - 删除查询规则集
  - 创建或更新查询规则
  - 获取查询规则
  - 删除查询规则
  - 测试查询规则集
- 重新加载搜索分析器 API
- 存储库计量 API
  - 获取存储库计量信息
  - 清除存储库计量存档
- 汇总 API
  - 创建汇总作业
  - 删除汇总作业
  - 获取作业
  - 获取汇总上限
  - 获取汇总索引上限
  - 汇总搜索
  - 启动汇总作业
  - 停止汇总作业
- 根 API
- 脚本 API
  - 创建或更新存储脚本
  - 删除存储脚本
  - 获取脚本上下文
  - 获取脚本语言
  - 获取存储脚本
- 搜索 API
  - 搜索
  - 异步搜索
  - 时间点
  - kNN 搜索
  - 检索器
  - 倒数排名融合
  - 滚动
  - 清除滚动
  - 搜索模板
  - 多搜索模板
  - 渲染搜索模板
  - 搜索分片
  - 建议器
  - 多搜索
  - 计数
  - 验证
  - 术语枚举
  - 解释
  - 剖析
  - 字段功能
  - 排名评估
  - 矢量图块搜索
- 搜索应用程序 API
  - 放置搜索应用程序
  - 获取搜索应用程序
  - 列出搜索应用程序
  - 删除搜索应用程序
  - 搜索应用程序搜索
  - 渲染搜索应用程序查询
- 可搜索快照 API
  - 挂载快照
  - 缓存统计
  - 可搜索快照统计
  - 清除缓存
- 安全 API
  - 身份验证
  - 更改密码
  - 清除缓存
  - 清除角色缓存
  - 清除权限缓存
  - 清除 API 密钥缓存
  - 清除服务帐户令牌缓存
  - 创建 API 密钥
  - 创建或更新应用程序权限
  - 创建或更新角色映射
  - 创建或更新角色
  - 批量创建或更新角色 API
  - 批量删除角色 API
  - 创建或更新用户
  - 创建服务帐户令牌
  - 委托 PKI 身份验证
  - 删除应用程序权限
  - 删除角色映射
  - 删除角色
  - 删除服务帐户令牌
  - 删除用户
  - 禁用用户
  - 启用用户
  - 注册 Kibana
  - 注册节点
  - 获取 API 密钥信息
  - 获取应用程序权限
  - 获取内置权限
  - 获取角色映射
  - 获取角色
  - 查询角色
  - 获取服务帐户
  - 获取服务帐户凭据
  - 获取安全设置
  - 获取令牌
  - 获取用户权限
  - 获取用户
  - 授予 API 密钥
  - 具有权限
  - 使 API 密钥失效
  - 使令牌失效
  - OpenID Connect 准备身份验证
  - OpenID Connect 身份验证
  - OpenID Connect 注销
  - 查询 API 密钥信息
  - 查询用户
  - 更新 API 密钥
  - 更新安全设置
  - 批量更新 API 密钥
  - SAML 准备身份验证
  - SAML 身份验证
  - SAML 注销
  - SAML 失效
  - SAML 完成注销
  - SAML 服务提供商元数据
  - SSL 证书
  - 激活用户配置文件
  - 禁用用户配置文件
  - 启用用户配置文件
  - 获取用户配置文件
  - 建议用户配置文件
  - 更新用户配置文件数据
  - 具有用户配置文件权限
  - 创建跨集群 API 密钥
  - 更新跨集群 API 密钥
- 快照和还原 API
  - 创建或更新快照存储库
  - 验证快照存储库
  - 存储库分析
  - 验证存储库完整性
  - 获取快照存储库
  - 删除快照存储库
  - 清理快照存储库
  - 克隆快照
  - 创建快照
  - 获取快照
  - 获取快照状态
  - 还原快照
  - 删除快照
- 快照生命周期管理 API
  - 创建或更新策略
  - 获取策略
  - 删除策略
  - 执行快照生命周期策略
  - 执行快照保留策略
  - 获取快照生命周期管理状态
  - 获取快照生命周期统计
  - 启动快照生命周期管理
  - 停止快照生命周期管理
- SQL API
  - 清除 SQL 光标
  - 删除异步 SQL 搜索
  - 获取异步 SQL 搜索
  - 获取异步 SQL 搜索状态
  - SQL 搜索
  - SQL 转换
- 同义词 API
  - 创建或更新同义词集
  - 获取同义词集
  - 列出同义词集
  - 删除同义词集
  - 创建或更新同义词规则
  - 获取同义词规则
  - 删除同义词规则
- 文本结构 API
  - 查找字段结构 API
  - 查找消息结构 API
  - 查找文本结构 API
  - 测试 Grok 模式
- 转换 API
  - 创建转换
  - 删除转换
  - 获取转换
  - 获取转换统计
  - 预览转换
  - 重置转换
  - 立即计划转换
  - 启动转换
  - 停止转换
  - 更新转换
  - 升级转换
- 使用情况 API
- Watcher API
  - 确认观察
  - 激活观察
  - 停用观察
  - 删除观察
  - 执行观察
  - 获取观察
  - 获取 Watcher 统计
  - 查询观察
  - 创建或更新观察
  - 更新 Watcher 设置
  - 获取 Watcher 设置
  - 启动观察服务
  - 停止观察服务
- 定义
  - 角色映射资源
迁移指南
- 8.17
- 8.16
- 8.15
- 8.14
- 8.13
- 8.12
- 8.11
- 8.10
- 8.9
- 8.8
- 8.7
- 8.6
- 8.5
- 8.4
- 8.3
- 8.2
- 8.1
- 8.0
  - Java 时间迁移指南
  - 瞬态设置迁移指南
发行说明
- Elasticsearch 版本 8.17.0
- Elasticsearch 版本 8.16.1
- Elasticsearch 版本 8.16.0
- Elasticsearch 版本 8.15.5
- Elasticsearch 版本 8.15.4
- Elasticsearch 版本 8.15.3
- Elasticsearch 版本 8.15.2
- Elasticsearch 版本 8.15.1
- Elasticsearch 版本 8.15.0
- Elasticsearch 版本 8.14.3
- Elasticsearch 版本 8.14.2
- Elasticsearch 版本 8.14.1
- Elasticsearch 版本 8.14.0
- Elasticsearch 版本 8.13.4
- Elasticsearch 版本 8.13.3
- Elasticsearch 版本 8.13.2
  - 错误修复
- Elasticsearch 版本 8.13.1
  - 错误修复
- Elasticsearch 版本 8.13.0
- Elasticsearch 版本 8.12.2
- Elasticsearch 版本 8.12.1
- Elasticsearch 版本 8.12.0
- Elasticsearch 版本 8.11.4
- Elasticsearch 版本 8.11.3
- Elasticsearch 版本 8.11.2
- Elasticsearch 版本 8.11.1
- Elasticsearch 版本 8.11.0
- Elasticsearch 版本 8.10.4
- Elasticsearch 版本 8.10.3
- Elasticsearch 版本 8.10.2
- Elasticsearch 版本 8.10.1
- Elasticsearch 版本 8.10.0
- Elasticsearch 版本 8.9.2
- Elasticsearch 版本 8.9.1
- Elasticsearch 版本 8.9.0
- Elasticsearch 版本 8.8.2
- Elasticsearch 版本 8.8.1
- Elasticsearch 版本 8.8.0
- Elasticsearch 版本 8.7.1
- Elasticsearch 版本 8.7.0
- Elasticsearch 版本 8.6.2
- Elasticsearch 版本 8.6.1
- Elasticsearch 版本 8.6.0
- Elasticsearch 版本 8.5.3
- Elasticsearch 版本 8.5.2
- Elasticsearch 版本 8.5.1
- Elasticsearch 版本 8.5.0
- Elasticsearch 版本 8.4.3
- Elasticsearch 版本 8.4.2
- Elasticsearch 版本 8.4.1
- Elasticsearch 版本 8.4.0
- Elasticsearch 版本 8.3.3
- Elasticsearch 版本 8.3.2
- Elasticsearch 版本 8.3.1
- Elasticsearch 版本 8.3.0
- Elasticsearch 版本 8.2.3
- Elasticsearch 版本 8.2.2
- Elasticsearch 版本 8.2.1
- Elasticsearch 版本 8.2.0
- Elasticsearch 版本 8.1.3
- Elasticsearch 版本 8.1.2
- Elasticsearch 版本 8.1.1
- Elasticsearch 版本 8.1.0
- Elasticsearch 版本 8.0.1
- Elasticsearch 版本 8.0.0
- Elasticsearch 版本 8.0.0-rc2
- Elasticsearch 版本 8.0.0-rc1
- Elasticsearch 版本 8.0.0-beta1
- Elasticsearch 版本 8.0.0-alpha2
- Elasticsearch 版本 8.0.0-alpha1
依赖项和版本

› › ›

节点

编辑

节点

编辑

每次启动 Elasticsearch 实例时，您都在启动一个节点。连接的节点集合称为集群。如果您正在运行单个 Elasticsearch 节点，则您拥有一个包含一个节点的集群。

默认情况下，集群中的每个节点都可以处理HTTP 和传输流量。传输层专门用于节点之间的通信；HTTP 层供 REST 客户端使用。

所有节点都了解集群中的所有其他节点，并且可以将客户端请求转发到相应的节点。

Elasticsearch 节点的性能通常受底层存储性能的限制。请查看我们关于优化存储以提高索引和搜索性能的建议。

节点角色

编辑

您可以通过在 elasticsearch.yml 中设置 node.roles 来定义节点的角色。如果设置 node.roles，则该节点仅分配您指定的角色。如果您不设置 node.roles，则该节点将被分配以下角色

master
data
data_content
data_hot
data_warm
data_cold
data_frozen
ingest
ml
remote_cluster_client
transform

如果设置了 node.roles，请确保指定集群所需的所有节点角色。每个集群都需要以下节点角色

master
data_content 和 data_hot
或
data

一些 Elastic Stack 功能还需要特定的节点角色

跨集群搜索和跨集群复制需要 remote_cluster_client 角色。
Stack Monitoring 和摄取管道需要 ingest 角色。
Fleet、Elastic Security 应用程序和转换需要 transform 角色。使用这些功能的跨集群搜索也需要 remote_cluster_client 角色。
机器学习功能，例如异常检测，需要 ml 角色。

随着集群的增长，特别是当您有大型机器学习作业或连续转换时，请考虑将专用的主节点与专用的数据节点、机器学习节点和转换节点分开。

主节点: 具有 master 角色的节点，使其有资格被选为主节点，控制集群。
数据节点: 具有多个数据角色之一的节点。数据节点保存数据并执行与数据相关的操作，例如 CRUD、搜索和聚合。具有通用 data 角色的节点可以填充任何专门的数据节点角色。
摄取节点: 具有 ingest 角色的节点。摄取节点能够将摄取管道应用于文档，以便在索引之前转换和丰富文档。在大量摄取负载的情况下，使用专用的摄取节点，并且不包括具有 master 或 data 角色的节点中的 ingest 角色是有意义的。
远程资格节点: 具有 remote_cluster_client 角色的节点，使其有资格充当远程客户端。
机器学习节点: 具有 ml 角色的节点。如果要使用机器学习功能，则集群中必须至少有一个机器学习节点。有关更多信息，请参阅机器学习设置和Elastic Stack 中的机器学习。
转换节点: 具有 transform 角色的节点。如果要使用转换，则集群中必须至少有一个转换节点。有关更多信息，请参阅转换设置和转换数据。

协调节点

诸如搜索请求或批量索引请求之类的请求可能涉及不同数据节点上保存的数据。例如，搜索请求分两个阶段执行，这两个阶段由接收客户端请求的节点（即协调节点）协调。

在分散阶段，协调节点将请求转发到保存数据的数据节点。每个数据节点在本地执行请求并将其结果返回给协调节点。在收集阶段，协调节点将每个数据节点的结果减少为单个全局结果集。

每个节点都隐式地是一个协调节点。这意味着具有通过 node.roles 显式定义的空角色列表的节点将仅充当协调节点，而无法禁用此功能。因此，这样的节点需要有足够的内存和 CPU 来处理收集阶段。

主节点

编辑

主节点负责轻量级集群范围的操作，例如创建或删除索引、跟踪哪些节点是集群的一部分以及决定将哪些分片分配给哪些节点。拥有一个稳定的主节点对于集群健康至关重要。

任何不属于仅投票节点的主资格节点都可以通过主选举过程被选为成为主节点。

主节点必须具有 path.data 目录，其内容在重启后仍然存在，就像数据节点一样，因为这是存储集群元数据的地方。集群元数据描述了如何读取存储在数据节点上的数据，因此如果丢失了，则无法读取存储在数据节点上的数据。

专用主资格节点

编辑

对于集群的健康状况，选出的主节点拥有履行其职责所需的资源非常重要。如果选出的主节点因其他任务而过载，则集群将无法正常运行。避免主节点因其他任务而过载的最可靠方法是将所有主资格节点配置为专用主资格节点，这些节点仅具有 master 角色，从而使它们能够专注于管理集群。主资格节点仍然会像协调节点一样，将客户端的请求路由到集群中的其他节点，但您应该不将专用主节点用于此目的。

如果其主资格节点具有其他角色和职责，则小型或负载较轻的集群可能会运行良好，但是一旦您的集群包含多个节点，通常就有必要使用专用主资格节点。

要创建专用主资格节点，请设置

node.roles: [ master ]

仅投票主资格节点

编辑

仅投票主资格节点是参与主选举的节点，但不会充当集群的选定主节点。特别是，仅投票节点可以在选举中充当平局决胜者。

使用术语“主资格”来描述仅投票节点似乎令人困惑，因为这样的节点实际上根本没有资格成为主节点。这种术语是历史遗留的不幸结果：主资格节点是那些参与选举并在集群状态发布期间执行某些任务的节点，而仅投票节点即使永远无法成为选定的主节点也具有相同的职责。

要将主资格节点配置为仅投票节点，请在角色列表中包括 master 和 voting_only。例如，要创建仅投票数据节点

node.roles: [ data, master, voting_only ]

只有具有 master 角色的节点才能标记为具有 voting_only 角色。

高可用性 (HA) 集群至少需要三个主资格节点，其中至少有两个不是仅投票节点。即使其中一个节点出现故障，这样的集群也能够选举出一个主节点。

仅投票主资格节点也可以在您的集群中填充其他角色。例如，一个节点可以同时是数据节点和仅投票主资格节点。专用仅投票主资格节点是集群中不填充其他角色的仅投票主资格节点。要创建专用仅投票主资格节点，请设置

node.roles: [ master, voting_only ]

由于专用仅投票节点永远不会充当集群的选定主节点，因此它们可能需要比真正的主节点更少的堆空间和更弱的 CPU。但是，包括仅投票节点在内的所有主资格节点都处于发布集群状态更新的关键路径上。集群状态更新通常独立于性能关键型工作负载（例如索引或搜索），但它们参与管理活动，例如索引创建和滚动、映射更新以及故障后的恢复。这些活动的性能特征是每个主资格节点上存储速度的函数，以及选定的主节点与集群中其他节点之间网络互连的可靠性和延迟的函数。因此，您必须确保您的集群中节点可用的存储和网络足以满足您的性能目标。

数据节点

编辑

数据节点保存包含您已索引文档的分片。数据节点处理与数据相关的操作，例如 CRUD、搜索和聚合。这些操作是 I/O、内存和 CPU 密集型的。监视这些资源并在它们过载时添加更多数据节点非常重要。

拥有专用数据节点的主要好处是主角色和数据角色的分离。

在多层部署架构中，您可以使用专门的数据角色将数据节点分配给特定层：data_content、data_hot、data_warm、data_cold 或 data_frozen。一个节点可以属于多个层。

如果要将节点包含在所有层中，或者您的集群未使用多个层，则可以使用通用的 data 角色。

集群分片限制阻止每个节点创建超过 1000 个非冻结分片，以及每个专用冻结节点创建 3000 个冻结分片。请确保您的集群中每种类型的节点都有足够的数量来处理您所需的分片数量。

如果您使用专门的数据角色将节点分配给特定层，则也不应为其分配通用的 data 角色。通用的 data 角色优先于专门的数据角色。

通用数据节点

编辑

所有内容层级都包含通用数据节点。

要创建专用的通用数据节点，请设置

node.roles: [ data ]

内容数据节点

编辑

内容数据节点是内容层的一部分。存储在内容层中的数据通常是项目集合，例如产品目录或文章存档。与时间序列数据不同，内容的值随时间推移保持相对恒定，因此将其移动到具有不同性能特征的层级是不合理的。内容数据通常具有较长的数据保留要求，并且您希望能够快速检索项目，无论它们有多旧。

内容层节点通常针对查询性能进行优化——它们优先考虑处理能力而非 IO 吞吐量，以便它们可以处理复杂的搜索和聚合并快速返回结果。虽然它们也负责索引，但内容数据的摄取速率通常不像时间序列数据（如日志和指标）那么高。从弹性的角度来看，此层中的索引应配置为使用一个或多个副本。

内容层是必需的，并且通常部署在与热层相同的节点组中。系统索引和其他不属于数据流的索引会自动分配到内容层。

要创建专用的内容节点，请设置

node.roles: [ data_content ]

热数据节点

编辑

热数据节点是热层的一部分。热层是 Elasticsearch 时间序列数据的入口点，并保存您最近、最常搜索的时间序列数据。热层中的节点需要快速进行读写，这需要更多的硬件资源和更快的存储（SSD）。为了弹性，热层中的索引应配置为使用一个或多个副本。

热层是必需的。属于数据流的新索引会自动分配到热层。

要创建专用的热节点，请设置

node.roles: [ data_hot ]

温数据节点

编辑

温数据节点是温层的一部分。一旦时间序列数据的查询频率低于热层中最近索引的数据，就可以将其移动到温层。温层通常保存最近几周的数据。仍然允许更新，但可能不频繁。温层中的节点通常不需要像热层中的节点那么快。为了弹性，温层中的索引应配置为使用一个或多个副本。

要创建专用的温节点，请设置

node.roles: [ data_warm ]

冷数据节点

编辑

冷数据节点是冷层的一部分。当您不再需要定期搜索时间序列数据时，可以将其从温层移动到冷层。虽然仍然可以搜索，但此层通常针对较低的存储成本进行优化，而不是搜索速度。

为了更好地节省存储空间，您可以在冷层上保留完全挂载的索引，这些索引是可搜索快照。与常规索引不同，这些完全挂载的索引不需要副本即可实现可靠性。如果发生故障，它们可以从底层快照中恢复数据。这可能会将数据所需的本地存储空间减半。必须有一个快照存储库才能在冷层中使用完全挂载的索引。完全挂载的索引是只读的。

或者，您可以使用冷层来存储带有副本的常规索引，而不是使用可搜索快照。这使您可以将旧数据存储在更便宜的硬件上，但与温层相比，不会减少所需的磁盘空间。

要创建专用的冷节点，请设置

node.roles: [ data_cold ]

冻结数据节点

编辑

冻结数据节点是冻结层的一部分。一旦数据不再被查询，或者很少被查询，它可能会从冷层移动到冻结层，并在那里度过其剩余的生命周期。

冻结层需要一个快照存储库。冻结层使用部分挂载的索引来存储和加载快照存储库中的数据。这减少了本地存储和运营成本，同时仍然允许您搜索冻结的数据。由于 Elasticsearch 有时必须从快照存储库中获取冻结的数据，因此在冻结层上的搜索通常比在冷层上的搜索慢。

要创建专用的冻结节点，请设置

node.roles: [ data_frozen ]

摄取节点

编辑

摄取节点可以执行由一个或多个摄取处理器组成的预处理管道。根据摄取处理器执行的操作类型和所需的资源，拥有专用的摄取节点可能是有意义的，这些节点将仅执行此特定任务。

要创建专用的摄取节点，请设置

node.roles: [ ingest ]

仅协调节点

编辑

如果您取消处理主节点职责、保存数据和预处理文档的能力，那么您将只剩下一个协调节点，该节点只能路由请求、处理搜索减少阶段和分配批量索引。本质上，仅协调节点的行为类似于智能负载均衡器。

仅协调节点可以通过从数据节点和有资格成为主节点的节点卸载协调节点角色来使大型集群受益。它们加入集群并接收完整的集群状态，就像其他每个节点一样，并且它们使用集群状态将请求直接路由到适当的位置。

向集群添加过多的仅协调节点会增加整个集群的负担，因为选定的主节点必须等待每个节点确认集群状态更新！不应过分夸大仅协调节点的好处——数据节点可以愉快地承担相同的用途。

要创建专用的协调节点，请设置

node.roles: [ ]

有资格作为远程节点的节点

编辑

有资格作为远程节点的节点充当跨集群客户端并连接到远程集群。连接后，您可以使用跨集群搜索搜索远程集群。您还可以使用跨集群复制在集群之间同步数据。

node.roles: [ remote_cluster_client ]

机器学习节点

编辑

机器学习节点运行作业并处理机器学习 API 请求。有关更多信息，请参阅机器学习设置。

要创建专用的机器学习节点，请设置

node.roles: [ ml, remote_cluster_client]

remote_cluster_client 角色是可选的，但强烈建议使用。否则，在机器学习作业或数据馈送中使用跨集群搜索时会失败。如果在异常检测作业中使用跨集群搜索，则所有有资格成为主节点的节点也需要 remote_cluster_client 角色。否则，数据馈送无法启动。请参阅有资格作为远程节点的节点。

转换节点

编辑

转换节点运行转换并处理转换 API 请求。有关更多信息，请参阅转换设置。

要创建专用的转换节点，请设置

node.roles: [ transform, remote_cluster_client ]

remote_cluster_client 角色是可选的，但强烈建议使用。否则，在转换中使用跨集群搜索时会失败。请参阅有资格作为远程节点的节点。

更改节点的角色

编辑

每个数据节点在磁盘上维护以下数据

分配给该节点的每个分片的分片数据，
与分配给该节点的每个分片对应的索引元数据，以及
集群范围的元数据，例如设置和索引模板。

同样，每个有资格成为主节点的节点在磁盘上维护以下数据

集群中每个索引的索引元数据，以及
集群范围的元数据，例如设置和索引模板。

每个节点在启动时都会检查其数据路径的内容。如果发现意外数据，则会拒绝启动。这是为了避免导入不需要的悬空索引，这可能会导致集群运行状况为红色。更准确地说，没有 data 角色的节点如果在启动时在磁盘上发现任何分片数据，则会拒绝启动，而没有 master 和 data 角色的节点如果在启动时在磁盘上发现任何索引元数据，则会拒绝启动。

可以通过调整节点的 elasticsearch.yml 文件并重新启动它来更改节点的角色。这被称为重新调整节点。为了满足上述对意外数据的检查，您必须执行一些额外的步骤来准备一个在没有 data 或 master 角色的情况下启动的节点以进行重新调整用途。

如果要通过删除 data 角色来重新调整数据节点的用途，则应首先使用分配筛选器将所有分片数据安全地迁移到集群中的其他节点上。
如果要重新调整节点的用途，使其既不具有 data 角色也不具有 master 角色，则最简单的方法是使用空数据路径和所需的角色启动一个全新的节点。您可能会发现最好先使用分配筛选器将分片数据迁移到集群中的其他位置。

如果无法执行这些额外的步骤，则可以使用elasticsearch-node repurpose工具删除任何阻止节点启动的多余数据。

节点数据路径设置

编辑

`path.data`

编辑

每个数据节点和有资格成为主节点的节点都需要访问一个数据目录，在该目录中存储分片以及索引和集群元数据。path.data 默认为 $ES_HOME/data，但可以在 elasticsearch.yml 配置文件中配置为绝对路径或相对于 $ES_HOME 的路径，如下所示

path.data:  /var/elasticsearch/data

与所有节点设置一样，它也可以在命令行中指定，如下所示

./bin/elasticsearch -Epath.data=/var/elasticsearch/data

path.data 目录的内容必须在重新启动时保持不变，因为这是存储数据的位置。Elasticsearch 要求文件系统的行为就像它由本地磁盘支持一样，但这意味着只要远程存储的行为与本地存储没有不同，它就可以在正确配置的远程块设备（例如，SAN）和远程文件系统（例如，NFS）上正常工作。您可以在同一文件系统上运行多个 Elasticsearch 节点，但每个 Elasticsearch 节点必须有自己的数据路径。

使用 .zip 或 .tar.gz 发行版时，应将 path.data 设置配置为将数据目录放置在 Elasticsearch 主目录之外，以便可以删除主目录而不会删除您的数据！RPM 和 Debian 发行版已经为您完成了这项工作。

请勿修改数据目录中的任何内容，或运行任何可能干扰其内容的过程。如果 Elasticsearch 以外的任何程序修改了数据目录的内容，则 Elasticsearch 可能会失败，报告损坏或其他数据不一致问题，或者可能看起来工作正常，但实际上已悄悄丢失了部分数据。请勿尝试对数据目录进行文件系统备份；不支持恢复此类备份。请使用快照与还原进行安全备份。请勿对数据目录运行病毒扫描程序。病毒扫描程序可能会阻止 Elasticsearch 正常工作，并可能修改数据目录的内容。数据目录不包含任何可执行文件，因此病毒扫描只会发现误报。

其他节点设置

编辑

更多节点设置可以在配置 Elasticsearch和重要的 Elasticsearch 配置中找到，包括

« Elasticsearch 中的监控设置网络 »

Was this helpful?

Feedback

The Search AI Company

Generative AI

Search

Security

Observability

By solution

Industries

节点

节点

节点角色

主节点

专用主资格节点

仅投票主资格节点

数据节点

通用数据节点

内容数据节点

热数据节点

温数据节点

冷数据节点

冻结数据节点

摄取节点

仅协调节点

有资格作为远程节点的节点

机器学习节点

转换节点

更改节点的角色

节点数据路径设置

path.data

其他节点设置

Follow us

About us

Join us

Partners

Trust & Security

Investor relations

Excellence Awards

`path.data`