Elasticsearch for Apache Hadoop

编辑

Elasticsearch for Apache Hadoop 是一个 开源、独立、自包含的小型库,它允许 Hadoop 作业(无论是使用 Map/Reduce 还是基于它的库,例如 Hive 或新的即将推出的库,例如 Apache Spark)与 Elasticsearch 进行交互。可以将其视为一个连接器,允许数据双向流动,以便应用程序能够透明地利用 Elasticsearch 引擎的功能来显著丰富其功能并提高性能。

Elasticsearch for Apache Hadoop 为原生 Map/Reduce 和 Hive 提供了一流的支持,因此使用 Elasticsearch 就如同使用 Hadoop 集群中的资源一样。因此,Elasticsearch for Apache Hadoop 是一个被动组件,允许 Hadoop 作业将其用作库,并通过 Elasticsearch for Apache Hadoop API 与 Elasticsearch 进行交互。

虽然项目的官方名称是 Elasticsearch for Apache Hadoop,但在整个文档中,将使用 elasticsearch-hadoop 术语来提高可读性。

如果您正在寻找 Elasticsearch HDFS 快照/恢复插件(一个单独的项目),请参阅其 主页