文档部分
编辑文档部分编辑
文档分为两部分
参考文档编辑
文档的这一部分解释了 elasticsearch-hadoop 的核心功能,从配置选项和架构开始,逐步解释了各种主要功能。在更高的层次上,参考分为架构和配置部分(这些部分是通用的)、Map/Reduce 和在其之上构建的库、即将推出的计算库(如 Apache Spark),最后是映射、指标和故障排除。
我们建议您在第一次尝试 elasticsearch-hadoop 时,即使只是粗略地浏览整个文档,但如果您赶时间,可以直接跳到所需的部分
- 架构
- elasticsearch-hadoop 架构及其在 Hadoop 之上的映射概述
- 配置
- 探索 elasticsearch-hadoop 中的各种配置开关
- Map/Reduce 集成
- 描述了如何在 vanilla Map/Reduce 环境中使用 elasticsearch-hadoop - 通常对那些有兴趣在 Elasticsearch 中加载和保存数据而几乎不需要 ETL(提取-转换-加载)的人来说很有用。
- Apache Hive 集成
- Hive 用户应参考本部分。
- Apache Spark 支持
- 描述了如何通过 elasticsearch-hadoop 将 Apache Spark 与 Elasticsearch 一起使用。
- 映射和类型
- 深入了解 elasticsearch-hadoop 用于进出 Elasticsearch 的类型转换和映射的策略。
- Hadoop 指标
- Elasticsearch Hadoop 指标
- 故障排除
- 有关故障排除和获取帮助的提示