生产就绪的十亿规模向量数据库 - Elasticsearch
了解使 Elasticsearch 和 Lucene 成为向量数据库首选的最新创新。
阅读博客了解如何使用 Elasticsearch 作为嵌入的向量数据库,为搜索提供支持并构建诸如检索增强生成 (RAG)、摘要和问答等用例。
在搜索实验室中了解更多信息Elastic 是第一个提供更好的二进制量化 (BBQ) 的公司,这是一种向量数据库的优化,可实现更快、更准确的向量搜索,并减少 95% 的内存。
了解有关 BBQ 的更多信息PUT _inference/text_embedding/my-e5-endpoint
{
"service": "elasticsearch",
"service_settings": {
"num_allocations": 1,
"num_threads": 1,
"model_id": ".multilingual-e5-small"
}
}
向量数据库超集
根据您想要构建的向量搜索体验选择向量数据库。
一些向量数据库
Elasticsearch
存储嵌入
完全支持
完全支持(免费)
生成嵌入
部分支持
完全支持(付费)
搜索嵌入
完全支持
完全支持(免费)
搜索 BM25
部分支持
完全支持(免费)
混合搜索 (BM25 + 向量)
完全支持
完全支持(免费)
过滤、分面、聚合
完全支持
完全支持(免费)
搜索自动完成
不支持
完全支持(免费)
针对多种数据类型(文本、向量、地理位置)进行了优化
部分支持
完全支持(免费)
支持多种嵌入模型
完全支持
完全支持(付费)
内置语义搜索模型
不支持
完全支持(付费)
数据推理管道
部分支持
完全支持(付费)
摄取工具(Web 爬虫*、连接器*、API 框架、Beats、Fleet、Agent)
部分支持
完全支持(*付费)
文档和字段级安全性
不支持
完全支持(付费)
Elasticsearch — 实践
了解组织如何构建 AI 搜索应用程序,以改善客户体验并帮助用户准确找到他们想要的内容。
客户聚焦
英国最大的招聘机构 Reed 使用 Elasticsearch 中的向量嵌入,将求职者和雇主联系在一起。
客户聚焦
Stack Overflow 将人类专家的力量与生成式 AI 相结合,以加速从开发者知识库中检索可信信息。
客户聚焦
Adobe 通过 Elastic 扩展、管理多个用例并应用机器学习功能。
开始实施向量搜索
博客
网络研讨会
演示项目
常见问题
向量数据库以向量形式存储信息,向量是数据对象的数值表示,也称为向量嵌入。它使用向量嵌入在大量结构化、非结构化和半结构化数据(例如图像、文本、视频和音频)中进行多模态搜索。向量数据库旨在管理向量嵌入,因此为数据管理提供了完整的解决方案。
向量嵌入利用机器学习模型将文本转换为数字,从而允许您执行向量搜索。通过将数据转换为向量,嵌入使得更容易比较、搜索和分析此空间中项目之间的相似性。
向量数据库通过支持跨本地和云环境的无缝数据迁移以及为向量嵌入提供存储,从而实现大规模效率。向量数据库擅长相似性搜索,使您可以轻松找到相关项目,这对于推荐系统、图像搜索和内容发现至关重要。借助语义搜索功能,它们超越了简单的关键字匹配,从而根据含义和上下文提供结果。通过存储向量嵌入,它们支持 AI 和机器学习应用程序,从而更容易部署 NLP 和推荐模型。
是的,Elasticsearch 是世界上部署最广泛的 开源 向量数据库,为您提供了一种高效的方法来大规模创建、存储和搜索向量嵌入。借助 Elastic 的企业级向量数据库,即使在快速变化的数据下,您也可以实现快速查询时间和最佳性能。它旨在扩展,在简化开发流程的同时,提供相关、个性化的搜索结果。