用于 Apache Hadoop 的 Elasticsearch

编辑

用于 Apache Hadoop 的 Elasticsearch

编辑

用于 Apache Hadoop 的 Elasticsearch 是一个开源、独立的、自包含的小型库,它允许 Hadoop 作业(无论是使用 Map/Reduce,还是基于它构建的库,如 Hive 或新兴的库,如 Apache Spark)与 Elasticsearch 进行交互。可以把它看作是一个连接器,允许数据双向流动,以便应用程序可以透明地利用 Elasticsearch 引擎的功能来显著丰富其能力并提高性能。

用于 Apache Hadoop 的 Elasticsearch 为原生的 Map/Reduce 和 Hive 提供了头等支持,因此使用 Elasticsearch 就像使用 Hadoop 集群中的资源一样。因此,用于 Apache Hadoop 的 Elasticsearch 是一个被动组件,允许 Hadoop 作业将其用作库,并通过用于 Apache Hadoop 的 Elasticsearch API 与 Elasticsearch 进行交互。

虽然该项目的官方名称是用于 Apache Hadoop 的 Elasticsearch,但在整个文档中将使用术语 elasticsearch-hadoop 来提高可读性。

如果您正在寻找 Elasticsearch HDFS 快照/恢复插件(一个单独的项目),请参阅其主页