搜索
制造业

LG CNS 实施 Elasticsearch 混合、向量和生成式 AI 功能,以提高准确性并缩短数据检索时间

下载 PDF

搜索准确性显著提高,从仅使用全文搜索的 75% 提高到使用混合搜索的 95%。

大规模数据搜索时间缩短一半以上

大规模数据检索时间从 0.2 秒减少到 0.1 秒,并通过生成式 AI 提高了答案生成速度。

在知识管理方面改善了员工搜索体验

LG CNS 通过 AI 模型对公司文档进行编码并在 Elasticsearch 中建立索引,从而改进了其 KM 模型。

KeyLook AI 算法与 Elasticsearch 合并,以将搜索时间减半并增强知识管理

LG CNS 是韩国领先的 IT 服务公司。它于 1987 年作为 LG 集团的子公司成立,提供咨询、系统集成、网络集成和业务流程外包服务。

除了参与大型公共 IT 基础设施项目外,LG CNS 还通过与开发中心和全球公司的合作积极进入全球市场。

随着生成式 AI的出现,许多公司都引入了相关技术以跟上这些进步。为了满足这一需求,LG CNS 正在开发具有生成式 AI 的项目,并为这些公司提供服务。特别是,其 KeyLook AI 搜索算法是其内部 AI 中心 LG CNS D&A 实验室正在开发的检索增强生成 (RAG) 系统。

最终目标是改进 KeyLook 的整体搜索功能,使其应用程序可以覆盖所有与搜索相关的领域。LG CNS 还希望通过其搜索算法实现在知识管理 (KM) 领域的创新愿景。为此,首先必须克服几个障碍。

需要采用向量搜索算法方法

在部署检索增强生成 (RAG) 系统期间,LG CNS 需要解决现有搜索算法不理解用户意图的问题。这需要从基于关键字的搜索算法转变为基于上下文的向量搜索方法。为了提高用于存储和执行搜索的数据库搜索能力,研究中心专注于开发一种模型以提高搜索准确性,并考虑引入外部解决方案。

LG CNS AI 实验室语言综合顾问 Youngmin Kim 说:“如果用户用韩语搜索术语‘区块链’,他们将不会获得英文搜索术语的结果。这可以通过手动解决,但需要比预期多得多的工时。”

LG CNS - factory line

LG CNS 利用多年大型 IT 项目成功的经验,在韩国和世界各地提供全面的咨询、系统建设和运营服务。

LG CNS 采用 Elasticsearch 来提高其 AI 搜索模型的准确性和速度。在评估了各种用于向量搜索的搜索引擎解决方案后,Elasticsearch 在计算资源方面被证明是最有效的,并且为 KNN 算法提供了最佳性能,从而显著加快了向量搜索的速度。最重要的是,Elasticsearch 支持 LG CNS 所需的稀疏向量模块。

Kim 说:“我们发现只有 Elasticsearch 支持我们的语义搜索用例。我们在研究期间开发的稀疏向量搜索表现出非常好的性能,我们想要一个可以配备它的搜索引擎。Elasticsearch 的稀疏向量模块允许我们在关键字不完全匹配以及包含含义相似或包含拼写错误的单词时执行搜索。在我们的合作伙伴的帮助下采用 Elasticsearch 的结果非常显著。”

“KeyLook 算法与 Elasticsearch 平台的集成有助于我们以 GenAI 驱动的对话形式搜索和利用我们需要的知识。”

– LG CNS AI 实验室语言综合顾问 Youngmin Kim, LG CNS 人工智能实验室语言顾问

“我们在 KorQuAD 2 数据集上测试了 KeyLook AI 模型,并结合了三个模块,包括 Elasticsearch 的全文搜索、向量搜索和语义搜索。结果,我们的搜索准确率从 75% 提高到 95%,提高了 20%,” Kim 说。“稀疏向量搜索使我们能够找到包含搜索词同义词的文档,而密集向量搜索则侧重于识别口语句子并理解意图。通过将这些模块与混合搜索相结合,我们显著提高了性能。”

将海量数据搜索时间缩短一半以上

搜索改进不仅仅是提高准确率。要处理海量数据,您必须能够快速检索要搜索的信息。最初,LG CNS 使用内存中的数据,并且搜索处理速度缓慢,内存扩展也受到限制。

鉴于 Elasticsearch 可以大规模处理大量数据,LG CNS 在本地集成了该平台,以提高其 KeyLook AI 搜索算法的搜索速度。

“我们在内存管理方面受益于 Elasticsearch 平台,” Kim 说。“我们拥有的数据越多,Elasticsearch 处理数据的速度就越快。借助 Elasticsearch 的优化和混合支持,在韩语 Web 文档中搜索 110,000 个问题和 10,000 个文档的时间已缩短一半以上,从 0.2 秒降至 0.1 秒。”

通过知识管理改善员工搜索体验

采用 Elasticsearch 也为 LG CNS 员工带来了好处。

KeyLook AI 算法利用生成式人工智能模型对企业数据进行编码,并在 Elasticsearch 中对其进行索引。当用户在搜索站点上输入问题时,KeyLook AI 会识别相关文档并将答案传递给 ChatGPT。然后,ChatGPT 会通过编译用户友好、易于理解的答案,将搜索结果传递给用户。

得益于 Elasticsearch 强大的安全性和索引功能,LG CNS 部署了更新后的搜索功能,目前正在知识管理部门进行试点。

管理员利用这些安全功能,根据级别的访问权限来过滤信息并提供搜索结果,从而提高整体企业知识搜索性能。

与传统的全文本搜索方法(会被不相关的信息所困扰)不同,Elasticsearch 凭借其倒排索引方法而拥有快速的搜索速度。这种方法可以让搜索者快速找到包含所需信息的文档。

“我们能够通过使用 AI 模型和 Elasticsearch 独特的反向索引方法对企业文档进行编码来发展我们的知识管理服务业务模型,这使用户能够快速找到他们正在寻找的信息,” Kim 解释道。

“Elasticsearch 是一个在搜索市场中提供高质量服务的平台,我们发现它是一个设计良好且可靠的解决方案。”

– Youngmin Kim, LG CNS 人工智能实验室语言顾问

将业务扩展到下一代知识管理服务行业

在借助 Elasticsearch 进行创新的同时,LG CNS 团队优先考虑用户满意度和便利性。

回顾改进 KeyLook AI 搜索算法性能的历程时,Kim 表达了他对 Elasticsearch 的多功能性和支持的信心。“我们对 Elasticsearch 非常满意,”他说。“我们看到了 Elasticsearch 通过查询提供的各种功能与 LG CNS 专注于 AI 搜索模型之间的良好协同作用。Elastic 的聚合功能使我们能够实时处理和分析数据,使我们能够快速访问最新信息,例如前 10 个搜索词和与用户问题类似的查询。这支持了我们的决策过程,使我们能够快速响应。”

“我们正在探索通过利用 Elasticsearch 支持的更多功能来提高 KeyLook AI 的速度和准确性,” Kim 继续说道。“此外,LG CNS 正在将其业务扩展到下一代知识管理服务,将分散的信息转化为有价值的资产。”

根据其技术收购路线图,LG CNS 计划在 KeyLook AI 功能中提供除韩语之外的多语言技术支持,并旨在扩大其此类 AI 服务的全球市场。

进一步阅读


解决方案