›

Apache Hadoop 的 Elasticsearch

Apache Hadoop 的 Elasticsearch编辑

Apache Hadoop 的 Elasticsearch 是一个开源、独立、自包含、小型库，它允许 Hadoop 作业（无论是使用 Map/Reduce 还是基于它的库，如 Hive 或新的即将推出的库，如 Apache Spark）与 Elasticsearch 交互。可以将其视为一个连接器，它允许数据双向流动，以便应用程序可以透明地利用 Elasticsearch 引擎功能来显著丰富其功能并提高性能。

Apache Hadoop 的 Elasticsearch 为原生 Map/Reduce 和 Hive 提供一流的支持，因此使用 Elasticsearch 就如同使用 Hadoop 集群中的资源一样。因此，Apache Hadoop 的 Elasticsearch 是一个被动组件，允许 Hadoop 作业将其用作库，并通过 Apache Hadoop 的 Elasticsearch API 与 Elasticsearch 交互。

虽然该项目的官方名称是 Apache Hadoop 的 Elasticsearch，但在整个文档中将使用 elasticsearch-hadoop 来提高可读性。

如果您正在寻找 Elasticsearch HDFS 快照/恢复插件（一个单独的项目），请参阅其主页。

« 前言文档部分 »