数据采集引擎
多样性是采集的关键
通过强大的预构建但完全可配置的数据采集工具和公开的 API,您可以完全控制采集管道,这些 API 使您可以按照自己的方式索引和管理数据。
数据提取
发现、提取、索引和同步您的所有网站内容 — 包括 PDF!使用 Elastic Open Web Crawler 将您的网页转换为可搜索的数据。
数据连接器
利用与流行的生产力工具的原生连接器和连接器客户端,以及方便的 API 来构建您的数据源的连接器。
采集 API
使用方便的索引端点来构建自定义采集管道,使用 JavaScript、Java 和 Python 等常用的语言客户端。
数据管道
通过现有的 Elasticsearch 索引或 Elasticsearch 查询语法,保持数据采集管道和管理到位。
将搜索添加到您的网站
索引网络内容的最快方法
无论您使用直观的 UI、灵活的 API 还是两者都使用,您都可以完全按照您想要的方式配置爬网。通过对爬网活动和历史记录的完全可见性,您可以清楚地了解索引性能。