什么是生成式人工智能?
生成式人工智能定义
针对学生的解释(基础)
生成式人工智能是一种可以创建新的和原创的内容(如艺术、音乐、软件代码和写作)的技术。当用户输入提示时,人工智能会根据它从互联网上的现有示例中学到的内容生成响应,通常会产生独特且富有创意的结果。
针对开发人员的解释(技术)
生成式人工智能是人工智能的一个分支,专注于能够生成原创内容的计算机模型。通过利用大型语言模型、神经网络和机器学习的力量,生成式人工智能能够产生模仿人类创造力的新颖内容。这些模型使用大型数据集和深度学习算法进行训练,这些算法学习数据中存在的底层结构、关系和模式。结果是基于输入提示的新颖和独特的输出,包括图像、视频、代码、音乐、设计、翻译、问答和文本。
生成式人工智能如何工作?
生成式人工智能模型的工作方式是使用受人脑神经元启发的神经网络来学习现有数据中的模式和特征。然后,这些模型可以生成与它们学习的模式一致的新数据。例如,在图像集上训练的生成式人工智能模型可以创建看起来与训练图像相似的新图像。这类似于语言模型如何根据提供的上下文词语生成大量的文本。
生成式人工智能利用诸如生成对抗网络 (GAN)、大型语言模型、变分自编码器模型 (VAE) 和transformers 等高级技术,在动态范围的领域中创建内容。下面将详细解释这些方法。
这些模型从大型数据集中学习,可以通过迭代训练过程改进其输出。该模型分析给定数据中的关系,有效地从提供的示例中获取知识。通过调整其参数并最小化所需输出和生成输出之间的差异,生成式人工智能模型可以不断提高其生成高质量、上下文相关内容的能力。结果,无论是异想天开的诗歌还是聊天机器人客户支持回复,通常都与人类生成的内容难以区分。
从用户的角度来看,生成式人工智能通常从引导内容生成的初始提示开始,然后进行探索和完善变化的迭代往复过程。
观看此视频,深入了解生成式人工智能的工作原理。了解在探索为您的企业或组织实施它时应考虑的事项。
生成式人工智能模型的类型
生成式人工智能采用各种模型来实现新颖和原创内容的创建。一些最常见的生成式人工智能模型类型包括
生成对抗网络(GANs): GAN 由两个关键组件组成:生成器和判别器。生成器基于从训练数据中学到的模式生成合成数据。判别器的作用是评估生成的这些数据与真实数据相比的真实性,并判断它是真实的还是伪造的。训练过程教会生成器产生更真实的输出,同时判别器在区分真实数据和合成数据方面的能力也会提高。GAN 广泛应用于图像生成领域,并在创建极其逼真的视觉效果方面展现出了令人印象深刻的成果。
变分自动编码器(VAEs): VAE 是学习对数据进行编码和解码的神经网络。编码器将输入数据压缩成一个称为潜在空间的低维表示。同时,解码器从潜在空间重建原始数据。VAE 通过对潜在空间中的点进行采样,并将它们解码成有意义的输出来生成新数据。这种方法在图像和音频合成中特别有价值,在这些领域中,可以通过操纵潜在表示来产生多样化和富有创意的输出。
大型语言模型(LLMs): 最常见类型的 LLM,如 ChatGPT(生成式预训练转换器),是在大量的文本数据上训练的。这些复杂的语言模型利用教科书、网站以及社交媒体帖子中的知识。它们利用转换器架构来理解并基于给定的提示生成连贯的文本。转换器模型是大型语言模型最常见的架构。它们由编码器和解码器组成,通过从给定提示中生成标记来发现它们之间的关系,从而处理数据。
本质上,转换器模型预测单词序列中下一个出现的单词,从而模拟人类的语音。LLM 能够进行逼真的对话、回答问题并生成富有创意、类似人类的回复,这使得它们非常适合从聊天机器人和内容创建到翻译等与语言相关的应用。
生成式人工智能有哪些好处?
生成式人工智能在个人和商业层面都提供了强大的好处。随着技术的不断发展,其影响只会越来越大。在短期内,最直接和最重要的好处之一是提高效率和简化工作流程。自动化任务的能力为个人和企业节省了宝贵的时间、精力和资源。从起草电子邮件到预订,生成式人工智能已经在提高效率和生产力。以下是生成式人工智能正在发挥作用的几个方面:
- 自动化的内容创建使企业和个人能够大规模生产高质量的定制内容。这已经在各个领域产生了影响,尤其是在广告、营销、娱乐和媒体制作领域。
- 生成式人工智能可以作为艺术家、设计师、作家、建筑师和其他创作者的灵感工具,使他们能够探索新的可能性、产生新想法并突破其创意工作的界限。通过与生成式人工智能协作,创作者可以达到曾经无法想象的生产力水平,从而为更多的艺术品、文学作品、新闻报道、建筑、视频、音乐和时尚铺平道路。
- 生成式人工智能模型可以用于需要新解决方案或想法的问题解决任务,以及用于分析数据以改进决策。例如,在产品设计中,人工智能驱动的系统可以生成新的原型或根据特定的约束和要求优化现有设计。研究和开发的实际应用具有潜在的革命性意义。在几秒钟内总结复杂信息的能力具有广泛的解决问题的好处。
- 对于开发人员而言,生成式人工智能可以简化编写、检查、实施和优化代码的过程。
- 对于面向消费者的企业而言,生成式人工智能驱动的聊天机器人和虚拟助手可以提供增强的客户支持,从而缩短响应时间并减轻资源负担。
生成式人工智能有哪些挑战和局限性?
尽管生成式人工智能具有巨大的潜力,但它也面临着某些挑战和局限性。一些主要关注的问题包括:
数据偏差: 生成式人工智能模型依赖于它们所训练的数据。如果训练数据包含偏差或局限性,这些偏差可能会反映在输出中。组织可以通过仔细限制其模型训练所使用的数据,或使用针对其特定需求的定制化、专业化模型来降低这些风险。
伦理考量: 生成式人工智能模型创建逼真内容的能力引发了伦理问题,例如它将对人类社会产生的影响,以及它被滥用或操纵的可能性。确保负责任和合乎道德地使用生成式人工智能技术将是一个持续存在的问题。
不可靠的输出: 已知生成式人工智能和 LLM 模型会产生幻觉般的反应,当模型无法访问相关信息时,这个问题会更加严重。这可能会导致向用户提供听起来真实且自信但不正确的答案或误导性信息。而且,内容听起来越真实,就越难识别不准确的信息。
领域特定性: 缺乏对领域特定内容的了解是 ChatGPT 等生成式人工智能模型的常见局限性。模型可以根据它们训练的信息(通常是公共互联网数据)生成连贯且上下文相关的响应,但它们通常无法访问特定领域的数据或提供依赖于独特知识库(例如组织的专有软件或内部文档)的答案。您可以通过提供访问特定于您领域的文档和数据来最大限度地减少这些限制。
时效性: 模型的新鲜度取决于它们所训练的数据。模型可以提供的响应基于“时间点”数据,而不是实时数据。
计算要求: 训练和运行大型生成式人工智能模型需要大量的计算资源,包括强大的硬件和大量的内存。这些要求可能会增加成本,并限制某些应用的访问性和可扩展性。
数据要求: 训练大型生成式人工智能模型还需要访问大量的数据语料库,这需要耗费大量的时间并且存储成本高昂。
来源问题: 生成式人工智能模型并不总是识别它们所引用的内容来源,从而引发了复杂的版权和归属问题。
缺乏可解释性: 生成式人工智能模型通常作为“黑匣子”运行,这使得理解它们的决策过程特别具有挑战性。缺乏可解释性可能会阻碍信任并限制在关键应用中的采用。
模型部署和管理流程: 选择正确的模型需要实验和快速迭代。对于许多开发人员来说,为生成式人工智能应用部署大型语言模型(LLM)既耗时又复杂,而且学习曲线陡峭。
有哪些流行的生成式人工智能模型?
生成式人工智能模型有多种形式,每种形式都有独特的功能和应用——并且生成式人工智能接口的数量似乎每天都在增加。目前,最流行和最强大的生成式人工智能模型包括:
ChatGPT
自 2022 年 11 月公开推出以来,ChatGPT 取得了巨大的成功,它是 大型语言模型,由 OpenAI 开发。它使用对话式聊天界面与用户交互并微调输出。它旨在理解并生成类似人类的文本提示响应,并且它已经展示出进行对话交流、相关地回答问题甚至展示幽默感的能力。
据报道,最初的 ChatGPT-3 版本(用户可以免费使用)是在互联网上的 45 TB 以上的文本数据上训练的。不久之后,微软将 GPT 的一个版本集成到其 Bing 搜索引擎中。而 OpenAI 升级后的、基于订阅的 ChatGPT-4 于 2023 年 3 月推出。
ChatGPT 使用最先进的转换器架构。GPT 代表“生成式预训练转换器”,并且转换器架构彻底改变了自然语言处理(NLP)领域。
DALL-E
同样来自 OpenAI 的 DALL-E 2 专注于生成图像。DALL-E 将 GAN 架构与变分自动编码器相结合,基于文本提示生成高度详细和富有想象力的视觉效果。借助 DALL-E,用户可以描述他们脑海中的图像和样式,模型将生成它。与 MidJourney 和新加入者 Adobe Firefly 等竞争对手一起,DALL-E 和生成式人工智能正在彻底改变图像的创建和编辑方式。随着整个行业新功能的出现,视频、动画和特效也将发生类似的转变。
Google Gemini
Gemini 最初基于 Google 的 LaMDA 系列大型语言模型的一个版本构建,然后升级到更高级的 PaLM 2,它是 Google 对 ChatGPT 的替代方案。Gemini 的功能类似,具有编码、解决数学问题、回答问题和写作的能力,以及提供 Google 搜索结果的能力。
生成式人工智能用例
尽管这项技术相对较新且发展迅速,但生成式人工智能已经在各种应用和行业中确立了稳固的地位。通过构建生成式人工智能驱动的用户应用,公司可以构建新的客户体验,从而提高满意度、收入和盈利能力,以及新的员工工作流程,从而提高生产力,同时降低成本和风险。用例包括:
- 技术领域的人工智能: 生成式人工智能可以帮助技术组织通过交互式支持和知识库来增强客户体验和服务,通过编写代码和模拟试验来加速产品研发,以及通过人工智能驱动的助手来重新定义员工工作流程,这些助手可以帮助快速合成和提取信息。
- 政府部门的人工智能: 国家和地方政府机构正在思考如何利用生成式人工智能来创建更加个性化、高度相关的公共服务、更准确的调查和情报分析、更高的员工生产力、为选民提供简化的数字体验等等。
- 金融服务领域的人工智能: 银行、保险公司、财富管理公司、信用机构和其他金融机构可以利用生成式人工智能来构建创新的客户体验,从而影响收入,例如零售银行助手、自助客户聊天机器人、虚拟财务顾问、贷款助手等等。生成式人工智能还可以提高员工查找相关信息以加快工作流程的能力。无论是欺诈检测、风险管理、市场研究还是销售和交易,人工智能驱动的助手都可以帮助减少手动任务花费的时间并加快决策速度。
- 广告和营销领域的人工智能: 生成式人工智能为广告和营销活动、社交媒体帖子、产品描述、品牌材料、营销电子邮件、个性化推荐以及许多其他有针对性的营销、追加销售和交叉销售策略提供自动化的低成本内容。通过基于消费者数据和分析生成定制内容,生成式人工智能可以提高客户参与度和转化率。它还可以帮助使用数据进行客户细分,以预测目标群体对广告系列的反应。
- 医疗保健领域的人工智能: 生成式人工智能模型可以辅助医学图像分析、疾病诊断、识别药物相互作用和加速药物发现,从而节省时间和资源。通过生成合成医学数据,这些模型可以帮助扩充有限的数据集,并提高诊断系统的准确性。
- 汽车和制造业的人工智能: 生成式人工智能为汽车和制造公司提供了相关工具包,以简化员工操作,例如识别运营技术问题、交互式供应链管理、使用数字孪生的预测性维护,或为任何业务线提供相关的虚拟助手。组织还可以开发交互式数字手册、自助服务聊天机器人、辅助产品配置器等,以改善客户体验和保留率。
- 艺术和媒体领域的人工智能: 或许在任何其他领域,生成式人工智能都在彻底改变创意领域。它可以帮助艺术家和设计师更快地创作独特作品,帮助音乐家创作新旋律,帮助游戏设计师渲染全新的世界,以及帮助电影制作人生成视觉效果和逼真的动画。电影和媒体公司还可以更经济地制作内容,例如使用原始演员的声音将作品翻译成不同的语言。
- 电子商务和零售领域的人工智能: 生成式人工智能可以通过使用购物者的购买模式来推荐新产品并创建更流畅的购物流程,从而帮助使电子商务更具个性化。对于零售商和电子商务企业而言,人工智能可以通过更直观的浏览到使用聊天机器人和人工智能信息支持的常见问题解答部分等人工智能支持的客户服务功能,来创造更好的用户体验。
生成式人工智能的未来发展方向是什么?
生成式人工智能的未来充满希望。随着技术的进步,日益复杂的生成式人工智能模型正在瞄准各种全球问题。人工智能有潜力通过生成和测试分子解决方案来快速加速药物发现和开发的研发过程。例如,辉瑞公司在冠状病毒大流行期间使用人工智能进行了疫苗试验1。人工智能也是许多环境挑战的新兴解决方案。值得注意的是,一些人工智能驱动的机器人已经在帮助海洋清洁工作。
生成式人工智能还能够生成超逼真、令人惊叹的原创和富有想象力的内容。营销、娱乐、艺术和教育等行业的各种内容将根据个人偏好和要求进行定制,从而可能重新定义创意表达的概念。技术进步最终可能会导致在虚拟现实、游戏和沉浸式故事体验中的应用,这些应用几乎与现实无法区分。
在短期内,生成式人工智能的影响将最直接地体现在我们每天使用的工具中嵌入的高级功能,从电子邮件平台和电子表格软件到搜索引擎、文字处理器、电子商务市场和日历。工作流程将变得更加高效,重复性任务将实现自动化。分析师预计将在所有市场领域看到巨大的生产力和效率提升。
组织将使用基于自身数据训练的定制生成式人工智能解决方案来改进从运营、招聘和培训到供应链、物流、品牌和沟通等各个方面。开发人员将使用它在极短的时间内编写出完美的代码。就像之前出现的许多具有根本性变革意义的技术一样,生成式人工智能有可能影响我们生活的方方面面。
深入了解 2024 年的技术搜索趋势。观看此网络研讨会,了解最佳实践、新兴方法以及顶级趋势如何影响 2024 年的开发人员。
使用 Elasticsearch 为生成式人工智能时代提供支持
随着越来越多的组织将生成式人工智能集成到其内部和外部运营中,Elastic 设计了 Elasticsearch Relevance Engine™ (ESRE),为开发人员提供支持基于人工智能的搜索应用程序所需的工具。ESRE 可以提高搜索相关性,并大规模生成嵌入和搜索向量,同时允许企业集成其转换器模型。
我们的相关性引擎是为构建人工智能驱动的搜索应用程序的开发人员量身定制的,其功能包括支持通过 API 集成第三方转换器模型,例如生成式人工智能以及 ChatGPT-3 和 ChatGPT-4。Elastic 提供了专有数据和生成式人工智能之间的桥梁,通过该桥梁,组织可以通过上下文窗口为生成式人工智能提供量身定制的、特定于业务的上下文。这种Elasticsearch 和 ChatGPT 之间的协同作用确保用户收到对其查询的事实性、上下文相关且最新的答案。
Elasticsearch 的检索能力与 ChatGPT 的自然语言理解能力的结合提供了无与伦比的用户体验,为信息检索和人工智能驱动的辅助设定了新标准。甚至对于安全性的未来也具有重要意义,ChatGPT 在改进检测、响应和理解方面具有潜在的雄心勃勃的应用。
了解如何使用 Playground 在您选择的平台上构建 RAG 系统,并使用不同的 LLM。要详细了解如何使用 Elastic 和生成式人工智能增强搜索,请注册免费演示。
探索更多生成式人工智能资源
- 探索 Playground
- 开始您的 GenAI 试用
- 超越 RAG 基础知识
- 如何将生成式人工智能投入运营
- 生成式人工智能的下一阶段为企业带来了绝佳的机会
- 15 个企业生成式人工智能用例
- 为什么利用生成式人工智能的力量始于搜索
- 了解人工智能客户支持:人工智能如何改变客户服务
- 用于业务可观察性的生成式人工智能
- 用于网络安全的生成式人工智能
- 如何选择向量数据库
- 如何制作聊天机器人:开发人员的注意事项
- Elastic 生成式人工智能工具和功能
生成式人工智能常见问题
ChatGPT 是否使用 Elasticsearch?
Elasticsearch 安全地为 ChatGPT 提供数据访问权限,以便生成更相关的响应。
生成式人工智能有哪些示例?
生成式人工智能的示例包括 ChatGPT、DALL-E、Google Gemini、Midjourney、Adobe Firefly 和 Stable Diffusion。
人工智能和机器学习有什么区别?
人工智能 (AI) 是指开发能够执行模拟人类智能任务的系统的广泛领域,而机器学习 (ML) 是 AI 的一个子集,涉及使用复杂的算法和技术,使系统能够从数据中学习、识别模式并在没有明确指令的情况下提高性能。
生成式人工智能词汇表
生成式对抗网络 (GAN):GAN 是一种神经网络架构,由生成器和鉴别器组成,它们协同工作以生成逼真且高质量的内容。
自动编码器:自动编码器是一种神经网络架构,它学习编码和解码数据,通常用于数据压缩和生成等任务。
循环神经网络 (RNN):RNN 是专门用于顺序数据处理的神经网络。它们具有记忆组件,可以保留先前步骤中的信息,使其适用于文本生成等任务。
大型语言模型 (LLM):大型语言模型(包括 ChatGPT)是基于大量文本数据训练的强大生成式人工智能模型。它们可以根据给定的提示生成类似人类的文本。
机器学习:机器学习是 AI 的一个子集,它使用算法、模型和技术使系统能够从数据中学习并在不遵循明确指令的情况下进行调整。
自然语言处理:自然语言处理是 AI 和计算机科学的一个子领域,涉及计算机与人类语言之间的交互。它涉及文本生成、情感分析和语言翻译等任务。
神经网络:神经网络是受人脑结构和功能启发而产生的算法。它们由相互连接的节点或神经元组成,这些节点或神经元处理和传输信息。
语义搜索:语义搜索是一种以理解搜索查询的含义和被搜索内容为中心的搜索技术。它的目标是提供更多上下文相关的搜索结果。
向量搜索:向量搜索是一种将数据点表示为高维空间中的向量的技术。它通过计算向量之间的距离来实现高效的相似性搜索和推荐系统。
脚注
1 “基于人工智能的数据驱动策略,以加速 COVID 疫苗的研发和临床试验”,Biomed Res Int. 2022,作者:Ashwani Sharma、Tarun Virmani、Vipluv Pathak、Anjali Sharma、Kamla Pathak、Girish Kumar 和 Devender Pathak,在线发布于 2022 年 7 月 6 日,访问时间为 2023 年 6 月 27 日