什么是情感分析?

情感分析定义

情感分析应用 NLP、计算语言学和机器学习来识别数字文本的情感基调。 这使组织能够识别对他们的品牌、产品、服务或想法的正面、中性或负面情感。最终,它通过使企业能够更好地了解他们的客户,为他们提供可操作的见解。

例如,流媒体平台可以通过分析社交媒体帖子中的文本,识别某部剧集的受欢迎程度。在这种情况下,情感分析使流媒体平台能够了解公众对内容的正面、中性或负面感受。情感分析的结果为平台提供了可操作的见解:取消剧集、续订剧集或做出不同的演员阵容和/或创意招聘决定。

情感分析与自然语言处理 (NLP)
情感分析是自然语言处理的一个子类别,这意味着它只是 NLP 执行的众多任务之一。自然语言处理使计算机能够理解人类的书面或口头语言。NLP 任务包括命名实体识别、问答、文本摘要、语言识别和自然语言生成。

情感分析与机器学习 (ML)
情感分析使用机器学习来执行对任何给定文本的分析。机器学习使用在馈送训练数据时“学习”的算法。通过使用机器学习,情感分析不断发展,以更好地解释它分析的语言。

情感分析与人工智能 (AI)
不要将情感分析与人工智能混淆。AI 更广泛地指的是机器模仿人类学习和解决问题能力的能力。机器学习是 AI 的一个子集,因此机器学习情感分析也是 AI 的一个子集。虽然这三者都相互关联,但它们并不相同。

情感分析与数据挖掘
情感分析是一种数据挖掘形式,专门针对文本数据进行挖掘以进行分析。数据挖掘仅仅是指从大型数据集中提取和分析数据以发现各种类型的信息和模式的过程。

情感分析的类型

情感分析有几种不同的类型,无论它是作为基于规则的、机器学习的还是混合分析执行。这些包括

  • 细粒度分析
  • 基于方面的分析
  • 情绪检测
  • 基于意图的分析

细粒度情感分析或分级情感分析,使企业能够研究客户在评论中的评分。细粒度分析还将极性细化为非常正面、正面、中性、负面和非常负面类别。因此,例如,1 星评论将被视为非常负面,3 星评论 - 中性,而 5 星评论将被视为非常正面。

基于方面的的情感分析或 ABSA,侧重于对服务或产品的单个方面的感情。例如,一家科技公司推出了一款新的无线耳机。需要考虑的方面可能是连接性、美学设计和声音质量。通过请求的分析分类,基于方面的的情感分析使企业能够捕捉到客户对他们产品或服务的特定部分的感受。“这些新耳机很性感”表明对耳机美学设计的感情。“我喜欢它们的外观,但音量控制有问题”可能会提醒企业注意实际的设计缺陷。

情绪检测情感分析超越了极性检测,以识别客户的情绪,例如快乐、悲伤或愤怒。这种类型的分析可以使用词典来评估主观语言。像糟糕和可耻这样的词暗示着愤怒。悲惨和毁灭性可能表明悲伤。令人兴奋或超级可能表明快乐。当然,词典不考虑上下文,人们以不同的方式表达他们的情绪。请考虑以下示例

像“卡住”和“令人沮丧”这样的词表示负面情绪,而“慷慨”则表示正面情绪。这种情绪是微妙的,情绪难以分类。

基于意图的情感分析使企业能够识别客户的意图和兴趣水平。不同类型的意图包括购买、升级、降级、取消或退订。基于意图的分析需要使用相关文本(例如客户电子邮件或查询)进行分类训练。例如,“我的存储空间用完了,我该怎么办?”可以被归类为升级机会。“我不喜欢我收到的样品,我不需要更多眼线笔”的意图可以被归类为取消,但也提醒企业注意服务改进的机会。这种类型的分析帮助企业管理和维护他们的客户群,并最大限度地提高销售机会。

如何应用情感分析

要完成情感分析,您需要

  1. 预处理您的文本,包括将句子标记化、词形还原到词根形式以及删除停用词。
  2. 提取特征,这可能包括将词形还原后的标记转换为数字表示或生成嵌入。
  3. 将情感分类器应用于您的数据。

情感分析可以通过三种方式进行

  • 基于规则的
  • 机器学习的
  • 混合的

基于规则的情感分析使用手动编写的算法(或规则)来评估语言。这些规则使用计算语言学方法,例如分词、词形还原、词干提取和词性标注。它们也可能使用词典(词汇库)。

这种类型的分析会解析句子中的特定词语,并评估其极性和主观性,以确定情感和意图。一旦对一个词语分配了极性(正面、负面),基于规则的方法就会计算给定文本中出现的正面或负面词语的数量,以确定其整体情感。

显而易见的缺点是,这种类型的系统需要大量的努力来创建所有规则。此外,这些规则没有考虑到词语在句子中的使用方式(其上下文)。虽然可以编写新的规则来适应复杂性,但这会影响分析的整体复杂性。保持这种方法的准确性还需要定期评估和微调。

机器学习情感分析是基于规则的情感分析的自动化版本,它依赖于机器学习 (ML) 功能。此模型需要将训练数据输入到 ML 情感分析工具中,以便它可以学习哪些词语对应于哪些极性。常见的训练数据示例包括电影评论、亚马逊产品评论或 Yelp 上评分的商业场所。Hugging Face,一个 AI 社区,提供开源库、数据集和模型,可以帮助构建和训练情感分析工具。

机器学习情感分析训练完成后,该过程归结为特征提取和分类。为了产生结果,机器学习情感分析方法将依赖于不同的分类算法,例如深度学习、朴素贝叶斯、线性回归或支持向量机。

混合情感分析结合了基于规则和机器学习的情感分析方法。当针对公司或用户的特定需求进行调整时,它可能是最准确的工具。它在情感更微妙的情况下特别有用,例如企业对企业 (B2B) 沟通,其中负面情绪以更专业的方式表达。

情感分析的用例

情感分析通过识别以下内容为企业提供可操作的见解:

  • 所用语言的极性(是正面、中性还是负面?)
  • 消费者反应的情感基调(他们是愤怒、快乐还是悲伤?)
  • 基调是否紧急
  • 消费者的意图或兴趣水平

作为自动化的意见挖掘,情感分析可以服务于多种商业目的。

评论
使用情感分析工具,企业可以收集和分析来自社交平台、博客文章以及各种讨论或评论论坛的评论、评论和提及。这些信息非常宝贵,可以让企业评估其品牌的认知度。

发现正面情绪可以帮助企业确定应该继续做的事情,而负面情绪可以帮助企业确定应该停止做的事情和开始做的事情。在这个用例中,情感分析是营销和品牌团队的有用工具。根据分析见解,他们可以调整策略以维护和提升品牌认知度和声誉。

社交媒体监控
客户对产品或服务的反馈可能会出现在互联网上的各种地方。手动和单独收集和分析这些评论效率低下。

情感分析工具可以立即检测到任何提及并立即提醒客户服务团队。这使公司能够跟踪客户态度,进而更有效地管理客户体验。情感分析工具还可以用于监控。作为品牌认知度监控的扩展,情感分析可以成为宝贵的危机预防工具。这使团队能够仔细监控软件升级和新发布以发现问题,并在出现问题时缩短响应时间。

市场趋势
情感分析是在进行市场研究时的一个有用工具,因为它允许组织对整个市场、细分市场以及特定产品和服务进行广泛的审查,从态度中获取见解,以更好地评估客户需求和期望。

情感分析中的常见挑战

语言是一种复杂、不完美且不断发展的 人类交流工具。由于情感分析依赖于语言解释,因此它本身就具有挑战性。

企业对企业评论
理解竞争对手的评论是情感分析的一个挑战。如果一家公司设置了一条规则来识别描述对其业务的情感的特定语言,那么用于描述竞争对手的相同语言也将被视为正面。例如

我喜欢 [您的公司] 的产品发货速度有多快。
我喜欢我可以与 [您的竞争对手] 协商我的发货时间窗口。

这两个陈述都是正面的,但情感分析工具不会区分公司及其竞争对手,除非它经过训练可以识别任何关于竞争对手的正面内容为负面。

反讽、讽刺和上下文
检测和理解面对面反讽和讽刺的挑战也扩展到情感分析。讽刺使用正面词语来描述负面情绪,问题是机器通常没有文本线索来区分真诚与讽刺或反讽。例如,针对“你喜欢在橙汁中加果肉吗?”, “哦,我的天,当然” 可以理解为正面,如果作者是真诚的,或者负面,如果作者是讽刺的。

上下文也会扭曲情感。考虑以下两种回应

“只有一点点。”
“很多!”

如果这些评论是对诸如“您推荐此产品的可能性有多大?”之类的问题的回应,则第一个回应被认为是负面的,而第二个回应是正面的。但是,如果提示是“价格调整让您感到困扰了吗?”,则极性会颠倒。

文化差异
特定于文化的语言使用是情感分析的主要挑战之一。考虑一下不同文化之间的幽默差异。即使在英语中,方言差异也使区分意义变得复杂。例如

“Pants” 在美式英语中指的是裤子。在英国,“pants” 指的是内衣。

这些差异会影响分析的准确性。习语也因文化而异。它们的分析是一个类似的挑战。

主观性
情感分析的主要挑战之一是语言是主观的。这使得将语言分类为整齐的类别、方面或极性变得复杂。考虑以下示例

“这款手机很棒” 明显表示正面情绪。
“这款手机很小” 很难分类。根据作者对尺寸的感受,它可能是正面、中性或负面的陈述。

给定词语的含义可能是主观的,因为上下文、反讽或讽刺的使用以及其他语言特点。

情感分析的优势

情感分析通过可操作的见解为其用户带来益处。作为一种工具,它的优势很多

实时地将客户情绪转化为可操作的见解
情感分析工具可以帮助防止不满和流失,甚至可以找到会成为您产品或服务的拥护者的客户。该工具可以分析调查或客户服务互动,以确定哪些客户是推广者或拥护者。相反,情感分析还可以帮助识别不满意的客户,他们的产品和服务响应提供了关于改进领域的宝贵见解。

大规模地挖掘文本以获取客户情绪
情感分析工具提供实时分析,这对预防和管理危机至关重要。在出现问题时立即收到警报,并抢先于即将发生的危机。作为一种意见挖掘工具,情感分析还为公关团队提供了宝贵的见解,以塑造策略和管理持续的危机。

改善客户服务
情感分析工具从各种来源同时提取大量数据:电子邮件、推文、评论、调查、民意调查和评论。文本分析工具可以帮助更好地管理客户服务运营,优先处理查询并自动跟踪不良互动,使管理人员能够培训处理难缠客户的客户服务代表。

情感分析的常见方法

情感分析有几种方法。您可以自己构建一个,购买云提供商的附加组件,或者投资现成的情感分析工具。有各种软件即服务 (SaaS) 情感分析工具可用,而 Python 或 Java 等开源库可用于构建您自己的工具。或者,云提供商提供他们自己的 AI 套件。

构建您自己的情感模型
您可以使用 NLP 库(例如 spaCy 或 NLTK)构建您自己的情感模型。对于那些雄心勃勃的人,您甚至可以从头开始构建!使用 Python 或 Javascript 进行情感分析可以让您更好地控制自定义。虽然自定义的好处很重要,但在做出决定时应考虑构建自己的工具所需的成本和时间。

使用交钥匙情感分析产品
您也可以购买解决方案,例如标准云提供商提供的 SaaS 产品。这可能包括 Amazon Comprehend、Google AI 和机器学习产品,或 Azure 的认知服务。SaaS 情感分析工具的优势在于它可以快速部署,而且成本通常只是定制工具的一小部分。训练工具的过程是简化的,不需要整个工程师和专家团队进行设置。

集成第三方情感分析
使用第三方解决方案(如 Elastic),您可以将您自己的或公开可用的情感模型上传到 Elastic 平台。然后,您可以实现分析存储在 Elastic 中的文本数据的语义的应用程序。

云提供商的 AI 套件
云提供商还将情感分析工具作为其 AI 套件的一部分。选项包括 Google AI 和机器学习产品,或 Azure 的认知服务。

随着 AI 技术的学习和改进,情感分析方法不断发展。成功的情感分析方法需要对训练模型进行持续调整,或者对购买的软件进行频繁更新。

使用 Elastic 开始使用情感分析

使用 Elastic 启动您的情感分析工具,以便您可以执行自己的意见挖掘并获得您需要的可操作见解。

情感分析词汇表

算法:计算机遵循的过程或规则集。

人工智能:机器和计算机系统对人类智能的模拟。

计算语言学:语言学的一个分支,它使用计算机科学理论来分析和合成语言和语音。

共指消解:识别文本中属于命名实体的所有词语的过程。

词形还原:将同一个词的不同屈折形式归类在一起的过程。

词典:一种语言的词汇词语清单。

机器学习:人工智能的一个子集,通过使用数据和算法,使计算机能够在没有提示的情况下学习。

命名实体识别:识别单词为专有名词或实体的过程。

自然语言处理:作为人工智能的一个子集,计算机科学的一个分支,致力于帮助计算机系统理解人类语言。

词性标注:在文本中标记一个词以对其所属的词性进行分类的过程(例如,apple = 名词;slowly = 副词;closed = 形容词)。

词干提取:将单词还原到其词干或词根形式的过程。

分词:将一段文本分成更小的单元(称为标记)的过程。

词义消歧:根据单词在上下文中的使用来识别单词含义的过程。