文档部分编辑

文档分为两部分

设置和要求编辑

部分概述了该项目及其要求(以及支持的环境和库),以及有关如何在您的环境中轻松安装 elasticsearch-hadoop 的信息。

参考文档编辑

文档的这一部分解释了 elasticsearch-hadoop 的核心功能,从配置选项和架构开始,逐步解释了各种主要功能。在更高的层次上,参考分为架构和配置部分(这些部分是通用的)、Map/Reduce 和在其之上构建的库、即将推出的计算库(如 Apache Spark),最后是映射、指标和故障排除。

我们建议您在第一次尝试 elasticsearch-hadoop 时,即使只是粗略地浏览整个文档,但如果您赶时间,可以直接跳到所需的部分

架构
elasticsearch-hadoop 架构及其在 Hadoop 之上的映射概述
配置
探索 elasticsearch-hadoop 中的各种配置开关
Map/Reduce 集成
描述了如何在 vanilla Map/Reduce 环境中使用 elasticsearch-hadoop - 通常对那些有兴趣在 Elasticsearch 中加载和保存数据而几乎不需要 ETL(提取-转换-加载)的人来说很有用。
Apache Hive 集成
Hive 用户应参考本部分。
Apache Spark 支持
描述了如何通过 elasticsearch-hadoop 将 Apache Spark 与 Elasticsearch 一起使用。
映射和类型
深入了解 elasticsearch-hadoop 用于进出 Elasticsearch 的类型转换和映射的策略。
Hadoop 指标
Elasticsearch Hadoop 指标
故障排除
有关故障排除和获取帮助的提示