- Elasticsearch 指南其他版本
- 8.17 中的新功能
- Elasticsearch 基础
- 快速入门
- 设置 Elasticsearch
- 升级 Elasticsearch
- 索引模块
- 映射
- 文本分析
- 索引模板
- 数据流
- 摄取管道
- 别名
- 搜索您的数据
- 重新排名
- 查询 DSL
- 聚合
- 地理空间分析
- 连接器
- EQL
- ES|QL
- SQL
- 脚本
- 数据管理
- 自动缩放
- 监视集群
- 汇总或转换数据
- 设置高可用性集群
- 快照和还原
- 保护 Elastic Stack 的安全
- Watcher
- 命令行工具
- elasticsearch-certgen
- elasticsearch-certutil
- elasticsearch-create-enrollment-token
- elasticsearch-croneval
- elasticsearch-keystore
- elasticsearch-node
- elasticsearch-reconfigure-node
- elasticsearch-reset-password
- elasticsearch-saml-metadata
- elasticsearch-service-tokens
- elasticsearch-setup-passwords
- elasticsearch-shard
- elasticsearch-syskeygen
- elasticsearch-users
- 优化
- 故障排除
- 修复常见的集群问题
- 诊断未分配的分片
- 向系统中添加丢失的层
- 允许 Elasticsearch 在系统中分配数据
- 允许 Elasticsearch 分配索引
- 索引将索引分配过滤器与数据层节点角色混合,以在数据层之间移动
- 没有足够的节点来分配所有分片副本
- 单个节点上索引的分片总数已超过
- 每个节点的分片总数已达到
- 故障排除损坏
- 修复磁盘空间不足的数据节点
- 修复磁盘空间不足的主节点
- 修复磁盘空间不足的其他角色节点
- 启动索引生命周期管理
- 启动快照生命周期管理
- 从快照恢复
- 故障排除损坏的存储库
- 解决重复的快照策略失败问题
- 故障排除不稳定的集群
- 故障排除发现
- 故障排除监控
- 故障排除转换
- 故障排除 Watcher
- 故障排除搜索
- 故障排除分片容量健康问题
- 故障排除不平衡的集群
- 捕获诊断信息
- REST API
- API 约定
- 通用选项
- REST API 兼容性
- 自动缩放 API
- 行为分析 API
- 紧凑和对齐文本 (CAT) API
- 集群 API
- 跨集群复制 API
- 连接器 API
- 数据流 API
- 文档 API
- 丰富 API
- EQL API
- ES|QL API
- 功能 API
- Fleet API
- 图表探索 API
- 索引 API
- 别名是否存在
- 别名
- 分析
- 分析索引磁盘使用量
- 清除缓存
- 克隆索引
- 关闭索引
- 创建索引
- 创建或更新别名
- 创建或更新组件模板
- 创建或更新索引模板
- 创建或更新索引模板(旧版)
- 删除组件模板
- 删除悬挂索引
- 删除别名
- 删除索引
- 删除索引模板
- 删除索引模板(旧版)
- 存在
- 字段使用情况统计信息
- 刷新
- 强制合并
- 获取别名
- 获取组件模板
- 获取字段映射
- 获取索引
- 获取索引设置
- 获取索引模板
- 获取索引模板(旧版)
- 获取映射
- 导入悬挂索引
- 索引恢复
- 索引段
- 索引分片存储
- 索引统计信息
- 索引模板是否存在(旧版)
- 列出悬挂索引
- 打开索引
- 刷新
- 解析索引
- 解析集群
- 翻转
- 收缩索引
- 模拟索引
- 模拟模板
- 拆分索引
- 解冻索引
- 更新索引设置
- 更新映射
- 索引生命周期管理 API
- 推理 API
- 信息 API
- 摄取 API
- 许可 API
- Logstash API
- 机器学习 API
- 机器学习异常检测 API
- 机器学习数据帧分析 API
- 机器学习训练模型 API
- 迁移 API
- 节点生命周期 API
- 查询规则 API
- 重新加载搜索分析器 API
- 存储库计量 API
- 汇总 API
- 根 API
- 脚本 API
- 搜索 API
- 搜索应用程序 API
- 可搜索快照 API
- 安全 API
- 身份验证
- 更改密码
- 清除缓存
- 清除角色缓存
- 清除权限缓存
- 清除 API 密钥缓存
- 清除服务帐户令牌缓存
- 创建 API 密钥
- 创建或更新应用程序权限
- 创建或更新角色映射
- 创建或更新角色
- 批量创建或更新角色 API
- 批量删除角色 API
- 创建或更新用户
- 创建服务帐户令牌
- 委托 PKI 身份验证
- 删除应用程序权限
- 删除角色映射
- 删除角色
- 删除服务帐户令牌
- 删除用户
- 禁用用户
- 启用用户
- 注册 Kibana
- 注册节点
- 获取 API 密钥信息
- 获取应用程序权限
- 获取内置权限
- 获取角色映射
- 获取角色
- 查询角色
- 获取服务帐户
- 获取服务帐户凭据
- 获取安全设置
- 获取令牌
- 获取用户权限
- 获取用户
- 授予 API 密钥
- 具有权限
- 使 API 密钥失效
- 使令牌失效
- OpenID Connect 准备身份验证
- OpenID Connect 身份验证
- OpenID Connect 注销
- 查询 API 密钥信息
- 查询用户
- 更新 API 密钥
- 更新安全设置
- 批量更新 API 密钥
- SAML 准备身份验证
- SAML 身份验证
- SAML 注销
- SAML 失效
- SAML 完成注销
- SAML 服务提供商元数据
- SSL 证书
- 激活用户配置文件
- 禁用用户配置文件
- 启用用户配置文件
- 获取用户配置文件
- 建议用户配置文件
- 更新用户配置文件数据
- 具有用户配置文件权限
- 创建跨集群 API 密钥
- 更新跨集群 API 密钥
- 快照和还原 API
- 快照生命周期管理 API
- SQL API
- 同义词 API
- 文本结构 API
- 转换 API
- 使用情况 API
- Watcher API
- 定义
- 迁移指南
- 发行说明
- Elasticsearch 版本 8.17.0
- Elasticsearch 版本 8.16.1
- Elasticsearch 版本 8.16.0
- Elasticsearch 版本 8.15.5
- Elasticsearch 版本 8.15.4
- Elasticsearch 版本 8.15.3
- Elasticsearch 版本 8.15.2
- Elasticsearch 版本 8.15.1
- Elasticsearch 版本 8.15.0
- Elasticsearch 版本 8.14.3
- Elasticsearch 版本 8.14.2
- Elasticsearch 版本 8.14.1
- Elasticsearch 版本 8.14.0
- Elasticsearch 版本 8.13.4
- Elasticsearch 版本 8.13.3
- Elasticsearch 版本 8.13.2
- Elasticsearch 版本 8.13.1
- Elasticsearch 版本 8.13.0
- Elasticsearch 版本 8.12.2
- Elasticsearch 版本 8.12.1
- Elasticsearch 版本 8.12.0
- Elasticsearch 版本 8.11.4
- Elasticsearch 版本 8.11.3
- Elasticsearch 版本 8.11.2
- Elasticsearch 版本 8.11.1
- Elasticsearch 版本 8.11.0
- Elasticsearch 版本 8.10.4
- Elasticsearch 版本 8.10.3
- Elasticsearch 版本 8.10.2
- Elasticsearch 版本 8.10.1
- Elasticsearch 版本 8.10.0
- Elasticsearch 版本 8.9.2
- Elasticsearch 版本 8.9.1
- Elasticsearch 版本 8.9.0
- Elasticsearch 版本 8.8.2
- Elasticsearch 版本 8.8.1
- Elasticsearch 版本 8.8.0
- Elasticsearch 版本 8.7.1
- Elasticsearch 版本 8.7.0
- Elasticsearch 版本 8.6.2
- Elasticsearch 版本 8.6.1
- Elasticsearch 版本 8.6.0
- Elasticsearch 版本 8.5.3
- Elasticsearch 版本 8.5.2
- Elasticsearch 版本 8.5.1
- Elasticsearch 版本 8.5.0
- Elasticsearch 版本 8.4.3
- Elasticsearch 版本 8.4.2
- Elasticsearch 版本 8.4.1
- Elasticsearch 版本 8.4.0
- Elasticsearch 版本 8.3.3
- Elasticsearch 版本 8.3.2
- Elasticsearch 版本 8.3.1
- Elasticsearch 版本 8.3.0
- Elasticsearch 版本 8.2.3
- Elasticsearch 版本 8.2.2
- Elasticsearch 版本 8.2.1
- Elasticsearch 版本 8.2.0
- Elasticsearch 版本 8.1.3
- Elasticsearch 版本 8.1.2
- Elasticsearch 版本 8.1.1
- Elasticsearch 版本 8.1.0
- Elasticsearch 版本 8.0.1
- Elasticsearch 版本 8.0.0
- Elasticsearch 版本 8.0.0-rc2
- Elasticsearch 版本 8.0.0-rc1
- Elasticsearch 版本 8.0.0-beta1
- Elasticsearch 版本 8.0.0-alpha2
- Elasticsearch 版本 8.0.0-alpha1
- 依赖项和版本
摄取处理器参考
编辑摄取处理器参考
编辑一个摄取管道由一系列处理器组成,这些处理器在文档摄取到索引时应用于文档。每个处理器执行特定的任务,例如过滤、转换或丰富数据。
每个后续处理器都依赖于前一个处理器的输出,因此处理器的顺序非常重要。修改后的文档在所有处理器应用后被索引到 Elasticsearch 中。
Elasticsearch 包括 40 多个可配置的处理器。本节中的子页面包含每个处理器的参考文档。要获取可用处理器的列表,请使用节点信息 API。
resp = client.nodes.info( node_id="ingest", filter_path="nodes.*.ingest.processors", ) print(resp)
response = client.nodes.info( node_id: 'ingest', filter_path: 'nodes.*.ingest.processors' ) puts response
const response = await client.nodes.info({ node_id: "ingest", filter_path: "nodes.*.ingest.processors", }); console.log(response);
GET _nodes/ingest?filter_path=nodes.*.ingest.processors
按类别划分的摄取处理器
编辑我们在此页面上对可用的处理器进行了分类并总结了它们的功能。这将帮助您找到适合您用例的处理器。
数据丰富处理器
编辑通用结果
编辑-
append
处理器 - 将值追加到字段。
-
date_index_name
处理器 - 根据日期或时间戳字段将文档指向正确的时间索引。
-
enrich
处理器 - 使用来自另一个索引的数据丰富文档。
有关如何使用enrich
处理器在摄取期间将现有索引中的数据添加到传入文档的详细示例,请参阅丰富您的数据。
-
inference
处理器 - 使用机器学习对文本字段进行分类和标记。
特定结果
编辑-
attachment
处理器 - 解析和索引二进制数据,例如 PDF 和 Word 文档。
-
circle
处理器 - 将位置字段转换为 Geo-Point 字段。
-
community_id
处理器 - 计算网络流数据的 Community ID。
-
fingerprint
处理器 - 计算文档内容的哈希值。
-
geo_grid
处理器 - 将网格瓦片或单元格的地理网格定义转换为描述其形状的常规边界框或多边形。
-
geoip
处理器 - 从 Maxmind 数据库添加有关 IPv4 或 IPv6 地址的地理位置信息。
-
ip_location
处理器 - 从 IP 地理位置数据库添加有关 IPv4 或 IPv6 地址的地理位置信息。
-
network_direction
处理器 - 根据源 IP 地址、目标 IP 地址和内部网络列表计算网络方向。
-
registered_domain
处理器 - 从完全限定的域名 (FQDN) 中提取已注册的域(也称为有效的顶级域名或 eTLD)、子域和顶级域名。
-
set_security_user
处理器 - 通过预处理摄取,将来自当前经过身份验证的用户的用户相关详细信息(例如
username
、roles
、email
、full_name
、metadata
、api_key
、realm
和authentication_type
)设置到当前文档中。 -
uri_parts
处理器 - 解析统一资源标识符 (URI) 字符串并将其组件提取为对象。
-
urldecode
处理器 - 对字符串进行 URL 解码。
-
user_agent
处理器 - 解析用户代理字符串以提取有关 Web 客户端的信息。
数据转换处理器
编辑通用结果
编辑-
convert
处理器 - 将当前摄取的文档中的字段转换为不同的类型,例如将字符串转换为整数。
-
dissect
处理器 - 从文档中的单个文本字段中提取结构化字段。与grok 处理器不同,dissect 不使用正则表达式。这使得 dissect 成为一种更简单且通常更快的替代方案。
-
grok
处理器 - 使用支持可重用别名表达式的Grok正则表达式方言,从文档中的单个文本字段中提取结构化字段。
-
gsub
处理器 - 通过应用正则表达式和替换来转换字符串字段。
-
redact
处理器 - 使用Grok规则引擎来模糊输入文档中与给定 Grok 模式匹配的文本。
-
rename
处理器 - 重命名现有字段。
-
set
处理器 - 在字段上设置值。
特定结果
编辑-
bytes
处理器 - 将人类可读的字节值转换为以字节为单位的值(例如,
1kb
变为1024
)。 -
csv
处理器 - 从文本字段中提取单行 CSV 数据。
-
date
处理器 - 提取和转换日期字段。
-
dot_expand
处理器 - 将带点的字段展开为对象字段。
-
html_strip
处理器 - 从字段中删除 HTML 标签。
-
join
处理器 - 使用元素之间的分隔符将数组的每个元素连接成一个字符串。
-
kv
处理器 - 解析包含键值对的消息(或特定事件字段)。
-
lowercase
处理器和uppercase
处理器 - 将字符串字段转换为小写或大写。
-
split
处理器 - 将字段拆分为值数组。
-
trim
处理器 - 修剪字段中的空格。
数据过滤处理器
编辑-
drop
处理器 - 删除文档而不引发任何错误。
-
remove
处理器 - 从文档中删除字段。
管道处理处理器
编辑-
fail
处理器 - 引发异常。当您期望管道失败并且想要向请求者传递特定消息时很有用。
-
pipeline
处理器 - 执行另一个管道。
-
reroute
处理器 - 将文档重新路由到另一个目标索引或数据流。
-
terminate
处理器 - 终止当前摄取管道,导致不再运行其他处理器。
数组/JSON 处理处理器
编辑-
for_each
处理器 - 在数组或对象的每个元素上运行摄取处理器。
-
json
处理器 - 将 JSON 字符串转换为结构化的 JSON 对象。
-
script
处理器 - 在传入文档上运行内联或存储的脚本。该脚本在painless
ingest
上下文中运行。 -
sort
处理器 - 按升序或降序对数组的元素进行排序。
添加其他处理器
编辑您可以将其他处理器作为插件安装。
您必须在集群中的所有节点上安装任何插件处理器。否则,Elasticsearch 将无法创建包含该处理器的管道。
通过在 elasticsearch.yml
中设置 plugin.mandatory
将插件标记为强制插件。如果未安装强制插件,节点将无法启动。
plugin.mandatory: my-ingest-plugin
Was this helpful?
Thank you for your feedback.