什么是生成式 AI?
生成式 AI 定义
面向学生的解释(基础)
生成式 AI 是一种可以创建新的和原创内容的技术,例如艺术、音乐、软件代码和写作。 当用户输入一个提示时,人工智能会根据其从互联网上现有的示例中学习到的内容生成响应,通常会产生独特且有创意的结果。
面向开发人员的解释(技术)
生成式 AI 是人工智能的一个分支,它围绕能够生成原创内容的计算机模型展开。 通过利用大型语言模型、神经网络和机器学习的力量,生成式 AI 能够生成模仿人类创造力的新内容。这些模型使用大型数据集和深度学习算法进行训练,这些算法学习数据中存在的潜在结构、关系和模式。结果是基于输入提示的新颖且独特的输出,包括图像、视频、代码、音乐、设计、翻译、问答和文本。
生成式人工智能是如何工作的?
生成式 AI 模型通过使用受人脑中神经元启发的神经网络来学习现有数据的模式和特征。然后,这些模型可以生成与它们学习到的模式一致的新数据。例如,在一个图像集中训练的生成式 AI 模型可以创建看起来类似于其训练图像的新图像。这类似于语言模型如何根据提供的上下文单词生成扩展文本。
生成式 AI 利用生成对抗网络 (GAN)、大型语言模型、变分自动编码器模型 (VAE) 和Transformer 等先进技术,在动态范围的领域中创建内容。下面将详细解释这些方法。
通过从大型数据集中学习,这些模型可以通过迭代训练过程来改进其输出。该模型分析给定数据中的关系,有效地从提供的示例中获取知识。通过调整其参数并最小化所需输出和生成输出之间的差异,生成式 AI 模型可以不断提高其生成高质量、上下文相关内容的能力。结果,无论是奇特的诗歌还是聊天机器人客户支持响应,通常都无法与人类生成的内容区分开来。
从用户的角度来看,生成式 AI 通常从一个初始提示开始,以指导内容生成,然后是一个迭代的来回过程,探索和改进变体。
观看此视频,深入了解生成式 AI 的工作原理。了解在探索将其用于您的企业或组织时需要考虑的事项。
生成式 AI 模型的类型
生成式 AI 采用各种模型来实现新颖和原创内容的创建。一些最常见的生成式 AI 模型类型包括
生成对抗网络 (GAN):GAN 包含两个关键组件:生成器和鉴别器。生成器根据其从训练数据中学习到的模式生成合成数据。鉴别器充当法官,评估生成数据的真实性与真实数据相比,并决定它是真实的还是假的。训练过程教会生成器生成更逼真的输出,而鉴别器则在区分真实数据和合成数据方面得到改进。GAN 广泛用于图像生成,并且在创建令人难以置信的逼真视觉效果方面取得了令人印象深刻的结果。
变分自编码器 (VAE):VAE 是一种神经网络,可以学习对数据进行编码和解码。编码器将输入数据压缩成一个称为潜在空间的低维表示。同时,解码器从潜在空间重建原始数据。VAE 能够通过对潜在空间中的点进行采样并将其解码为有意义的输出,从而生成新数据。这种方法在图像和音频合成中特别有价值,其中潜在表示可以被操纵以产生多样化和创造性的输出。
大型语言模型 (LLM):最常见的 LLM 类型,如 ChatGPT(生成式预训练转换器),是在大量文本数据上训练的。这些复杂的语言模型利用从教科书和网站到社交媒体帖子的知识。它们利用转换器架构来理解和生成基于给定提示的连贯文本。 转换器模型 是大型语言模型最常见的架构。它们由编码器和解码器组成,通过从给定提示中生成标记来处理数据,以发现它们之间的关系。
本质上,转换器模型预测在单词序列中下一个出现的单词,以模拟人类语言。LLM 能够进行真实的对话、回答问题和生成创造性的、类似人类的响应,使其成为语言相关应用的理想选择,从聊天机器人和内容创作到翻译。
生成式 AI 的优势是什么?
生成式 AI 在个人和商业层面都提供了强大的优势。随着技术的不断发展,其影响力只会越来越大。在短期内,最直接和最重要的益处之一是提高效率和简化工作流程。自动执行任务的能力为个人和企业节省了宝贵的时间、精力和资源。从起草电子邮件到预订,生成式 AI 已经提高了效率和生产力。以下是生成式 AI 正在发挥作用的一些方式
- 自动化的内容创作使企业和个人能够大规模地生产高质量的定制内容。这已经在各个领域产生了影响,尤其是在广告、营销、娱乐和媒体制作领域。
- 生成式 AI 可以作为艺术家、设计师、作家、建筑师和其他创作者的灵感工具,使他们能够探索新的可能性,产生新的想法,并突破其创造性工作的界限。通过与生成式 AI 合作,创作者可以实现以前无法想象的生产力水平,为更多艺术作品、文学作品、新闻报道、建筑、视频、音乐和时尚铺平道路。
- 生成式 AI 模型可用于解决问题任务,这些任务需要新的解决方案或想法,以及分析数据以改进决策。例如,在产品设计中,AI 驱动的系统可以根据特定约束和要求生成新的原型或优化现有设计。其在研发方面的实际应用具有潜在的革命性意义。并且能够在几秒钟内总结复杂信息具有广泛的解决问题的好处。
- 对于开发人员来说,生成式 AI 可以简化编写、检查、实施和优化代码的过程。
- 对于面向消费者的企业来说,生成式 AI 驱动的聊天机器人和虚拟助手可以提供增强的客户支持,减少响应时间并减轻资源负担。
生成式 AI 的挑战和局限性是什么?
虽然生成式 AI 具有巨大的潜力,但它也面临着一些挑战和局限性。一些主要问题包括
数据偏差:生成式 AI 模型依赖于它们接受训练的数据。如果训练数据包含偏差或局限性,这些偏差可能会反映在输出中。组织可以通过仔细限制其模型接受训练的数据,或使用针对其特定需求的定制的、专门的模型来减轻这些风险。
伦理考量:生成式 AI 模型创建逼真内容的能力引发了伦理问题,例如它将对人类社会产生的影响,以及其被滥用或操纵的可能性。确保负责任和合乎道德地使用生成式 AI 技术将是一个持续存在的问题。
不可靠的输出:生成式 AI 和 LLM 模型已知会产生幻觉响应,当模型缺乏对相关信息的访问时,这个问题会加剧。这可能导致提供给用户的答案不正确或误导性信息,这些信息听起来很真实且自信。而且内容听起来越逼真,就越难识别不准确的信息。
领域特异性:缺乏对领域特定内容的了解是 ChatGPT 等生成式 AI 模型的常见局限性。模型可以根据它们接受训练的信息(通常是公共互联网数据)生成连贯且上下文相关的响应,但它们通常无法访问领域特定数据或提供依赖于独特知识库的答案,例如组织的专有软件或内部文档。可以通过提供对特定于您领域的文档和数据的访问来最大限度地减少这些局限性。
时效性:模型的时效性仅与其接受训练的数据一样新鲜。模型可以提供的响应基于“时间点”数据,而不是实时数据。
计算需求:训练和运行大型生成式 AI 模型需要大量的计算资源,包括强大的硬件和大量的内存。这些需求会增加成本,并限制某些应用的可访问性和可扩展性。
数据需求:训练大型生成式 AI 模型还需要访问大量数据,这些数据的存储可能需要时间和成本。
来源问题:生成式 AI 模型并不总是识别它们所借鉴内容的来源,这引发了复杂的版权和归属问题。
缺乏可解释性:生成式 AI 模型通常作为“黑盒子”运行,这使得理解它们的决策过程特别具有挑战性。缺乏可解释性会阻碍信任并限制其在关键应用中的采用。
模型部署和管理流程:选择合适的模型需要实验和快速迭代。并且将大型语言模型 (LLM) 部署到生成式 AI 应用中对于许多开发人员来说既耗时又复杂,学习曲线陡峭。
哪些是流行的生成式 AI 模型?
生成式 AI 模型有多种形式,每种形式都有独特的功能和应用——而且生成式 AI 接口的数量似乎每天都在增加。目前,最流行和最强大的生成式 AI 模型包括
ChatGPT
ChatGPT 自 2022 年 11 月公开发布以来取得了巨大成功,它是由 OpenAI 开发的 大型语言模型。它使用对话式聊天界面与用户交互并微调输出。它旨在理解和生成对文本提示的类似人类的响应,并且它已经证明了能够进行对话交流、相关地回答问题,甚至展示幽默感。
据报道,最初的 ChatGPT-3 版本(对用户免费提供)是在来自互联网的超过 45 TB 的文本数据上训练的。微软在不久之后将其 GPT 版本集成到其必应搜索引擎中。OpenAI 的升级版、基于订阅的 ChatGPT-4 于 2023 年 3 月发布。
ChatGPT 使用最先进的转换器架构。GPT 代表“生成式预训练转换器”,转换器架构彻底改变了 自然语言处理 (NLP) 领域。
DALL-E
DALL-E 2,同样来自 OpenAI,专注于生成图像。DALL-E 将 GAN 架构与变分自编码器相结合,根据文本提示生成高度详细且富有想象力的视觉结果。使用 DALL-E,用户可以描述他们想到的图像和风格,模型将生成它。与 MidJourney 等竞争对手以及新兴的 Adobe Firefly 相比,DALL-E 和生成式 AI 正在彻底改变图像的创建和编辑方式。随着整个行业新兴能力的出现,视频、动画和特效也将在类似程度上发生转变。
Google Bard
最初构建在 Google 的 LaMDA 大型语言模型系列的一个版本上,然后升级到更先进的 PaLM 2,Bard 是 Google 对 ChatGPT 的替代方案。Bard 的功能类似,能够编写代码、解决数学问题、回答问题和写作,以及提供 Google 搜索结果。
生成式 AI 使用案例
尽管这项技术相对年轻且发展迅速,但生成式 AI 已经在各种应用和行业中站稳了脚跟。通过构建生成式 AI 驱动的用户应用程序,公司可以构建新的客户体验,推动满意度、收入和盈利能力,以及新的员工工作流程,这些工作流程可以提高生产力,同时降低成本和风险。使用案例包括
- AI 在科技领域: 生成式 AI 可以帮助科技组织通过交互式支持和知识库来增强客户体验和服务,通过编写代码和模拟试验来加速产品研发,以及通过 AI 驱动的助手来重新定义员工工作流程,这些助手可以帮助快速合成和提取信息。
- AI 在政府领域: 国家和地方政府机构正在考虑生成式 AI 如何创建更个性化、更相关的公共服务、更准确的调查和情报分析、更高的员工生产力、为选民提供简化的数字体验等等。
- AI 在金融服务领域: 银行、保险公司、财富管理公司、信用机构和其他金融机构可以利用生成式 AI 来构建影响顶线收入的创新客户体验,例如零售银行助手、自助客户聊天机器人、虚拟理财顾问、贷款助手等等。生成式 AI 还可以提高员工查找相关信息的能力,从而加快他们的工作流程。无论是欺诈检测、风险管理、市场研究还是销售和交易,AI 驱动的助手都可以帮助减少在手动任务上花费的时间并加快决策速度。
- AI 在广告和营销领域:生成式 AI 为广告和营销活动、社交媒体帖子、产品描述、品牌材料、营销电子邮件、个性化推荐以及许多其他针对性营销、追加销售和交叉销售策略提供自动化的、低成本的内容。生成式 AI 可以根据消费者数据和分析生成定制内容,从而提高客户参与度和转化率。它还可以帮助使用数据进行客户细分,以预测目标群体对活动的响应。
- AI 在医疗保健领域: 生成式 AI 模型可以帮助进行医学图像分析、疾病诊断、识别药物相互作用以及加速药物发现,从而节省时间和资源。通过生成合成医学数据,模型可以帮助补充有限的数据集并提高诊断系统的准确性。
- 汽车和制造业中的 AI: 生成式 AI 为汽车和制造公司提供了相关工具包,以简化员工运营,例如识别运营技术问题、交互式供应链管理、使用数字孪生的预测性维护或任何业务线的相关虚拟助手。组织还可以寻求开发交互式数字手册、自助聊天机器人、辅助产品配置器等,以改善客户体验和留存率。
- 艺术和媒体中的 AI: 也许比任何其他领域更重要的是,生成式 AI 正在彻底改变创意领域。它可以帮助艺术家和设计师更快地生成独特作品,帮助音乐家创作新旋律,帮助游戏设计师渲染全新的世界,帮助电影制作人生成视觉效果和逼真的动画。电影和媒体公司还可以更经济地制作内容,例如使用原始演员的声音将作品翻译成不同的语言。
- 电子商务和零售中的 AI: 生成式 AI 可以通过使用购物者的购买模式来推荐新产品并创建更无缝的购物流程,帮助电子商务更加个性化。对于零售商和电子商务企业,AI 可以通过更直观的浏览、使用聊天机器人的 AI 驱动的客户服务功能以及 AI 驱动的常见问题解答部分,创造更好的用户体验。
生成式 AI 的下一步是什么?
生成式 AI 的未来充满了希望。随着技术的进步,越来越复杂的生成式 AI 模型正在针对各种全球性问题。AI 有潜力通过生成和测试分子解决方案来快速加速药物发现和开发研究,从而加快研发过程。例如,辉瑞在冠状病毒大流行期间使用 AI 来运行 疫苗试验1。AI 也是许多环境挑战的新兴解决方案。值得注意的是,一些 AI 驱动的机器人 已经在帮助海洋清理工作中发挥作用。
生成式 AI 还能够生成超现实和惊人原创、富有想象力的内容。营销、娱乐、艺术和教育等行业的跨行业内容将根据个人喜好和需求进行定制,可能会重新定义创意表达的概念。最终,进展可能会导致虚拟现实、游戏和沉浸式叙事体验中的应用,这些体验几乎与现实无法区分。
在短期内,生成式 AI 的影响将最直接地体现在我们每天使用的工具中,从电子邮件平台和电子表格软件到搜索引擎、文字处理器、电子商务市场和日历。工作流程将变得更高效,重复性任务将实现自动化。分析师预计,所有市场部门的生产力和效率都将大幅提高。
组织将使用针对其自身数据训练的定制生成式 AI 解决方案来改进从运营、招聘和培训到供应链、物流、品牌和沟通的一切。开发人员将使用它以极短的时间编写完美的代码。与之前出现的许多具有根本性变革意义的技术一样,生成式 AI 有可能影响我们生活的方方面面。
深入了解 2024 年的技术搜索趋势。观看此网络研讨会,了解最佳实践、新兴方法以及顶级趋势如何影响 2024 年的开发人员。
使用 Elasticsearch 驱动生成式 AI 时代
随着越来越多的组织将生成式 AI 整合到其内部和外部运营中,Elastic 设计了 Elasticsearch Relevance Engine™ (ESRE),为开发人员提供构建基于人工智能的搜索应用程序所需的工具。ESRE 可以提高搜索相关性并生成 嵌入 和搜索向量,同时允许企业集成自己的转换器模型。
我们的相关性引擎是 专门为构建 AI 驱动的搜索应用程序的开发人员量身定制的,其功能包括支持通过 API 集成第三方转换器模型,例如生成式 AI 和 ChatGPT-3 以及 ChatGPT-4。Elastic 在 专有数据和生成式 AI 之间架起了一座桥梁,组织可以通过上下文窗口为生成式 AI 提供定制的、特定于业务的上下文。这种 Elasticsearch 和 ChatGPT 之间的协同作用 确保用户能够收到针对其查询的真实、上下文相关且最新的答案。
Elasticsearch 的检索能力和 ChatGPT 的自然语言理解能力的结合提供了 无与伦比的用户体验,为信息检索和 AI 驱动的辅助设定了新的标准。甚至对 安全 的未来也有一些影响,可能 ChatGPT 的雄心勃勃的应用 可以提高检测、响应和理解能力。
要了解有关使用 Elastic 和生成式 AI 加速搜索的更多信息,请注册 免费演示。
探索更多生成式 AI 资源
- 选择 LLM:2024 年开源 LLM 入门指南
- AI 搜索算法解释
- 什么是大型语言模型?
- 生成式 AI 在高等教育 IT 中的作用
- 使用生成式 AI 彻底改变澳大利亚政府服务
- AI 革命的先进搜索
- ChatGPT 和 Elasticsearch:OpenAI 满足私有数据
- Elastic 在 Microsoft Build 上
您接下来应该做什么
无论何时准备好... 以下四种方法可以帮助您利用企业数据的见解
- 开始免费试用,了解 Elastic 如何帮助您的企业。
- 浏览我们的解决方案,了解 Elasticsearch 平台的工作原理以及我们的解决方案如何满足您的需求。
- 了解如何在企业中交付生成式 AI.
- 与您认识的可能喜欢阅读本文的人分享。通过电子邮件、LinkedIn、Twitter 或 Facebook 与他们分享。
生成式 AI 常见问题解答
ChatGPT 是否使用 Elasticsearch?
Elasticsearch 安全地为 ChatGPT 提供对数据的访问权限,以生成更相关的响应。
生成式 AI 的一些示例是什么?
生成式 AI 的示例包括 ChatGPT、DALL-E、Google Bard、Midjourney、Adobe Firefly 和 Stable Diffusion。
人工智能和机器学习有什么区别?
人工智能 (AI) 指的是开发能够执行模拟人类智能的任务的系统的广泛领域,而 机器学习 (ML) 是 AI 的一个子集,涉及使用复杂的算法和技术,使系统能够从数据中学习、识别模式并提高性能,而无需明确的指令。
生成式 AI 词汇表
生成对抗网络 (GAN):GAN 是一种 神经网络架构,由一个生成器和一个鉴别器组成,它们协同工作以生成逼真且高质量的内容。
自动编码器:自动编码器是一种神经网络架构,它学习对数据进行编码和解码,通常用于数据压缩和生成等任务。
循环神经网络 (RNN):RNN 是专门用于处理顺序数据的专门神经网络。它们具有记忆组件,使它们能够保留来自先前步骤的信息,这使得它们适合文本生成等任务。
大型语言模型 (LLM):大型语言模型,包括 ChatGPT,是经过大量文本数据训练的强大生成式 AI 模型。它们可以根据给定的提示生成类似人类的文本。
机器学习:机器学习是 AI 的一个子集,它使用算法、模型和技术使系统能够从数据中学习并适应,而无需遵循明确的指令。
自然语言处理:自然语言处理是 AI 和计算机科学的一个子领域,它关注计算机与人类语言之间的交互。它涉及文本生成、情感分析 和语言翻译等任务。
神经网络:神经网络是受人脑结构和功能启发的算法。它们由相互连接的节点或神经元组成,这些节点处理和传输信息。
语义搜索:语义搜索是一种搜索技术,其核心是理解搜索查询和被搜索内容的含义。它旨在提供更具上下文相关性的搜索结果。
向量搜索:向量搜索是一种将数据点表示为高维空间中的向量的技术。通过计算向量之间的距离,它可以实现高效的相似性搜索和推荐系统。
脚注
1 "基于人工智能的数据驱动策略,加速 COVID 疫苗的研究、开发和临床试验," 生物医学研究国际 2022 年,作者:Ashwani Sharma、Tarun Virmani、Vipluv Pathak、Anjali Sharma、Kamla Pathak、Girish Kumar 和 Devender Pathak,于 2022 年 7 月 6 日在线发表,于 2023 年 6 月 27 日访问