零售行业对话式搜索体验:结合 Google Cloud 生成式 AI 和 Elasticsearch Relevance Engine

这篇博客介绍了一种使用 Vertex AI 和 Elasticsearch 结合生成式 AI 为零售商打造的全新搜索体验。

先前发布在 Google Cloud 博客

对于零售商来说,网站和移动应用程序中强大的搜索功能至关重要。然而,大多数现有的搜索体验都比较基础和有限,主要返回基于关键词相关性的结果列表。通常情况下,客户对他们想要的东西只有一个模糊的概念,而不是明确的商品。例如,他们可能在搜索一张漂亮的餐桌,但并不确定款式、尺寸、形状或其他细节。毫不奇怪,许多客户在搜索尝试失败后会离开零售网站。这不仅剥夺了他们可能获得的令人满意的购物体验,也代表着零售商失去的商机。

今天,我们很高兴地介绍一种使用 Vertex AI 和 Elasticsearch® 结合生成式 AI 为零售商打造的全新搜索体验。此增强型界面为用户提供了交互式对话体验,可以总结相关数据并根据每个客户的独特需求定制响应,同时利用零售商的公共和内部知识。例如,可以包括来自零售商领域专业知识的公共知识

  • 解决您特定需求的指南和常见场景
  • 与您的请求匹配的类似产品的评论摘要
  • 有关如何构建、组合或使用产品的公开参考

或者,知识可以是零售商的私有知识

  • 用户的通用位置以及可能适用的当地法规
  • 实时更新的产品目录、附近库存和价格
  • 私有文档和知识

这种高级搜索体验并非仅仅生成简单的相关项目列表,而是更像是一位拥有深入领域知识的礼宾销售代表。它在客户的整个购买旅程中提供帮助和指导,创造更具吸引力和高效的购物体验。

架构

下图说明了 Google Cloud 生成式 AI 服务和 Elastic 搜索功能的集成,这些功能构成了这种新用户体验的基础。

搜索查询的生命周期

在此架构中,搜索查询分为两个主要阶段。

1. 初始查询处理和增强

用户通过在搜索页面上提交查询或问题来启动此过程。

然后,此查询以及其他相关元数据(如通用地理位置、会话信息或零售商认为重要的任何其他数据)将转发到 Elastic Cloud。

Elastic Cloud 使用此查询和元数据对特定领域的客户数据执行搜索,在此过程中收集丰富的上下文信息。

  1. 来自多个内部公司数据源(ERP、CRM、WMS、BigQuery、GCS 等)的相关实时数据通过其一组 集成 持续索引到 Elastic 中,并且相关的嵌入通过您选择的 Transformer 模型 或内置的 Elastic Learned Sparse EncodeR (ELSER) 创建。推理可以通过 摄取管道 自动应用于每个数据流。
  2. 然后,嵌入作为密集向量存储在 Elastic 的 向量数据库 中。
  3. 使用 搜索 API,Elasticsearch 开始在其索引中执行搜索,并在单个调用中同时进行文本搜索和向量搜索。同时,它会根据接收到的用户查询文本生成向量。
  4. 生成的嵌入通过 向量搜索 与之前摄取数据的密集向量进行比较,使用 kNN(K 近邻算法)。

结合语义和文本搜索结果生成输出,并使用 倒数排名融合 (RRF) 混合排序。

2. 使用生成式 AI 生成结果

原始查询和新获得的丰富上下文信息将转发到 Vertex AI 对话。 对话式 AI 是一套面向设计人员和开发人员的对话式 AI 工具、解决方案和 API。在此设计中,我们将使用 Vertex AI 对话中的 Dialogflow CX 作为对话式 AI,并与 其 API 集成。

使用 Dialogflow CX API 时,您的系统需要:

  1. 构建一个代理。
  2. 为最终用户提供用户界面。
  3. 为每次对话轮次调用 Dialogflow API,将最终用户的输入发送到 API。
  4. 除非您的代理响应完全是静态的(不常见),否则请托管一个 Webhook 服务来处理支持 Webhook 的履行。

有关使用 API 的更多详细信息,请参阅 Dialogflow CX API 快速入门

对话式 AI 模块访问部署在您的 Vertex AI 租户中的 LLM 模型的端点,以生成用自然语言表达的完整响应,将模型知识与 Elastic 提供的私有数据合并。这是通过以下方式实现的:

  1. 从模型花园中选择您喜欢的模型
  2. 如果需要,根据您的领域任务对其进行微调
  3. 将模型部署到 Google Cloud 项目中的端点
  4. 从 Dialogflow 工作流中使用端点

为了管理数据访问控制并确保隐私,Vertex AI 使用 IAM 进行资源访问管理。您可以灵活地在项目或资源级别控制访问权限。有关更多详细信息,请参阅 Google 文档。请参阅以下部分以了解此步骤的更多详细信息。

Dialogflow 通过对话式响应使聊天机器人体验更具可操作性,根据上下文为用户提供相关的操作(例如,下订单或导航到内容)。

响应会传回给用户。

Elastic Cloud:从企业数据构建上下文

使用生成式 AI 时,上下文窗口有助于在查询时将其他用户提示的实时私有数据传递到模型,与您提交的问题并行。这使用户能够根据 LLM 训练的公共知识获得更好的答案,但也能够在您提供的特定领域中获得答案。生成式 AI 的有效性高度依赖于输入工程,上下文确实可以提高结果的质量。

用户通过您的网站搜索框提交问题后,Elasticsearch 会深入您的内部知识库,搜索相关内容,并将其返回以供等待的生成模型进一步处理。 搜索 来自您企业内部多个不同数据源的信息是 Elasticsearch 的设计目标。

但是,当上下文窗口大小 有限 时,常见模型仅允许处理几千个标记。因此,不可能将整个企业数据集传递到每个查询中。此外,用户提交的查询越大,性能和成本的影响就越大。您需要在将查询发送到生成式 AI 之前过滤和查找相关上下文。

Elasticsearch 相关性引擎™ (ESRE) 是一个基于 Elastic 在搜索和 AI 领域多年研发和专业知识构建的软件包,旨在帮助客户利用 Elasticsearch 的强大功能以及高端机器学习功能。ESRE 利用文本、图像、音频和视频的高级向量搜索功能,从海量异构数据集快速检索相关结果,同时结合 Elasticsearch 索引上的经典关键词文本搜索。借助 ESRE,不仅可以检索到所有相关信息,还可以确保信息安全,这得益于适用于 Elastic 处理的所有内容的文档级和字段级安全

使用 Elastic,您可以自由选择和运行自己的机器学习 (ML) 模型来创建嵌入或进行特征提取,从而根据您的特定领域、语言和数据类型实现完全控制和自定义。然后,Vertex AI 可以帮助您创建 Transformer 模型并导入到 Elastic 平台。如果您希望快速入门,而没有内部 ML 技能,也无需担心:开箱即用的ELSER检索模型只需点击几下即可启动并运行。

在 Vertex AI 中微调基础模型

提示设计策略和上下文窗口可能不足以调整模型行为。

模型花园:Vertex AI 模型花园是一个丰富的预构建 ML 模型存储库,可满足各种用例的需求。这些企业级模型经过精心测试和优化,以满足企业应用程序的性能和精度需求。它们通过 API、Notebook 和 Web 服务提供用户友好的访问。这些模型旨在实现可扩展性,可以处理大量数据并为众多用户提供服务。此外,它们可以免费访问,并定期更新新模型。

模型自定义:零售商可能更喜欢与基础模型交互以使其适应其独特需求。微调是一种有效且经济的方法,可以提高模型特定任务的性能或在指令不足时满足不同的输出要求。但是,从头开始开发和训练新的基础模型可能成本很高。诸如高效参数调整之类的技术在实现现有大型语言模型 (LLM) 之上的适配器层时降低了开销。这些层为模型补充了您特定的缺失知识,同时保留了它们已建立的技能。

安全和隐私:虽然消费者 AI 助手通常很强大,但您并不总能控制其功能和安全性。完全了解您的数据使用方式以及存储方式对于合规性、隐私和保持竞争优势至关重要。谷歌的安全 AI 框架为以负责任的方式构建和部署 AI 技术提供了明确的行业标准。这就是为什么通过谷歌的Vertex AI功能为企业采用生成式 AI 如此明智的原因。

企业级解决方案:Vertex AI 生成式 AI Studio提供对尖端模型的访问,并允许浏览各种版本和修改。自定义后,您可以对其进行测试、部署并将其与托管在 Google Cloud 上的其他应用程序和平台集成。这可以通过 Vertex AI SDK 或直接通过 Google Cloud 控制台完成,即使没有专门的数据科学专业知识,也几乎对任何人都很友好。

负责任的 AI:能力越大,责任越大。大型语言模型 (LLM) 能够翻译语言、压缩文本以及生成创意写作、代码和图像等众多任务。然而,作为一项新兴技术,其不断发展的能力和应用可能会导致潜在的误用、错用和意外后果。这些模型有时可能会生成不可预测的输出,包括可能具有冒犯性、不敏感或事实错误的文本。谷歌致力于促进负责任地使用这项技术,提供安全功能和过滤器来保护用户并确保遵守其AI 原则对负责任 AI 的承诺

后续步骤

构建您自己的生成式 AI 支持的客户互动零售应用程序从未如此简单:查看Elastic 的官方 GitHub 存储库,该存储库将帮助您使用 ESRE 和 Vertex AI 创建和运行电子商务搜索栏,并提供分步指南。

如果您有兴趣通过代码示例进一步探索,Google Lab 提供了一份题为Dialogflow CX:构建零售虚拟代理的综合指南。有关 Google 生成式 AI 设计的其他示例,我们建议您访问生成式 AI 示例页面。

担心您 Vertex AI 模型和服务的用量?探索 Elastic 如何提供端到端的可观察性平台,该平台直接利用来自 Google Cloud运营套件的所有日志、指标和跟踪,这得益于原生集成

不要错过这项突破性创新。我们鼓励您探索并采用此解决方案,并开始改变客户的购物体验。最佳的入门方法是使用您的 Google Cloud 帐户在 Elastic Cloud 上创建一个免费 14 天试用版集群,或通过Google Cloud Marketplace轻松订阅 Elastic Cloud。

Elasticsearch 与业界领先的生成式 AI 工具和提供商具有原生集成。查看我们关于超越 RAG 基础知识的网络研讨会Beyond RAG Basics,或关于构建生产就绪型应用程序的网络研讨会Elastic Vector Database

要为您的用例构建最佳搜索解决方案,请开始免费云试用版或立即在您的本地机器上试用 Elastic。

准备好构建最先进的搜索体验了吗?

充分先进的搜索并非一人之力所能成就。Elasticsearch 由数据科学家、ML Ops 工程师以及许多其他对搜索与您一样充满热情的人员提供支持。让我们联系起来,共同努力构建神奇的搜索体验,让您获得想要的结果。

亲自尝试