文档章节

编辑

本文档分为两部分

设置与需求

编辑

章节提供了项目概述、其需求(以及支持的环境和库),以及如何在您的环境中轻松安装 elasticsearch-hadoop 的信息。

参考文档

编辑

本部分文档解释了 elasticsearch-hadoop 的核心功能,从配置选项和架构开始,逐步解释各种主要功能。在更高层次上,参考文档分为架构和配置章节(通用部分),Map/Reduce 及其上构建的库,即将推出的计算库(如 Apache Spark),最后是映射、指标和故障排除。

我们建议首次尝试使用 elasticsearch-hadoop 时,即使只是粗略地浏览整篇文档。但是,如果时间紧迫,可以直接跳转到所需的章节。

架构
elasticsearch-hadoop 架构概述及其在 Hadoop 之上的映射方式。
配置
探索 elasticsearch-hadoop 中的各种配置开关。
Map/Reduce 集成
描述如何在普通的 Map/Reduce 环境中使用 elasticsearch-hadoop——通常对于那些感兴趣在 Elasticsearch 之间加载和保存数据,而几乎不需要或不需要 ETL(提取-转换-加载)的人很有用。
Apache Hive 集成
Hive 用户应参考此章节。
Apache Spark 支持
描述如何通过 elasticsearch-hadoop 使用 Apache Spark 与 Elasticsearch。
映射和类型
深入探讨 elasticsearch-hadoop 用于对 Elasticsearch 进行类型转换和映射的策略。
Hadoop 指标
Elasticsearch Hadoop 指标
故障排除
有关故障排除和寻求帮助的技巧。