什么是情感分析?
情感分析定义
情感分析应用自然语言处理、计算语言学和机器学习来识别数字文本的情感基调。 这使组织能够识别其品牌、产品、服务或想法的积极、中性或消极情绪。最终,它通过使企业更好地了解其客户,为企业提供可操作的见解。
以情感分析为例,流媒体平台可以通过对社交媒体帖子的文本分析来识别一个剧集的受欢迎程度。 在这种情况下,情感分析使流媒体能够了解公众对内容的感觉是积极、中性还是消极。 情感分析的结果为平台提供了可操作的见解:取消该剧集、续订该剧集,或做出不同的演员和/或创意招聘决策。
情感分析与自然语言处理 (NLP)
情感分析是自然语言处理的一个子类别,这意味着它只是 NLP 执行的众多任务之一。 自然语言处理使计算机能够理解人类书写或口头语言。 NLP 任务包括命名实体识别、问题解答、文本摘要、语言识别和自然语言生成。
情感分析与机器学习 (ML)
情感分析使用机器学习来执行对任何给定文本的分析。 机器学习使用在输入训练数据时“学习”的算法。 通过使用机器学习,情感分析不断发展以更好地解释它分析的语言。
情感分析与人工智能 (AI)
情感分析不应与人工智能混淆。 人工智能更广泛地指机器模仿人类学习和解决问题能力的能力。 机器学习是人工智能的一个子集,因此机器学习情感分析也是人工智能的一个子集。 虽然这三者之间存在联系,但它们并不相同。
情感分析与数据挖掘
情感分析是一种数据挖掘形式,专门挖掘文本数据进行分析。 数据挖掘只是指提取和分析大型数据集以发现各种类型的信息和模式的过程。
情感分析的类型
情感分析有几种不同的类型,无论它是作为基于规则的、机器学习的还是混合分析执行的。 这些包括
- 细粒度分析
- 基于方面的分析
- 情绪检测
- 基于意图的分析
细粒度情感分析,或称分级情感分析,允许企业研究客户在评论中的评分。细粒度分析还将极性细化为非常积极、积极、中性、消极和非常消极等类别。例如,1 星评价将被认为是极其消极的,3 星评价为中性,5 星评价将被视为非常积极的。
基于方面的情感分析,或称 ABSA,侧重于对服务或产品的单个方面的感受。例如,一家科技公司推出了一款新的无线耳机。需要考虑的一些方面可能包括连接性、美学设计和音质。通过请求的分析分类,基于方面的情感分析允许企业捕捉客户对其产品或服务特定部分的感受。“这款新耳机很性感” 表明对耳机美学设计的感受。“我喜欢它的外观,但音量控制是个问题” 可能会提醒企业注意一个实际的设计缺陷。
情绪检测情感分析超越了极性检测,以识别客户的感受,如快乐、悲伤或愤怒。这种类型的分析可以使用词汇表来评估主观语言。像“可怕”和“可耻”这样的词表示愤怒。“痛苦”和“毁灭性”可能表示悲伤。“令人兴奋”或“超级”可能表示快乐。当然,词汇表不能解释上下文,而且人们表达情感的方式也不同。考虑以下示例
像“卡住”和“令人沮丧”这样的词表示消极情绪,而“慷慨”则是积极的。这种情感是细微的,很难进行分类。
基于意图的情感分析允许企业识别客户的意图和兴趣水平。不同的意图类型包括购买、升级、降级、取消或退订。基于意图的分析需要使用相关文本(如客户电子邮件或查询)进行分类训练。例如,“我的存储空间不足,我该怎么办?” 可以被归类为升级机会。“我不喜欢我收到的样品,我不需要更多的眼线笔” 可以被归类为取消,但也提醒企业注意改进服务的机会。这种类型的分析有助于企业管理和维护其客户群,并最大化销售机会。
如何应用情感分析
要完成情感分析,您需要
- 预处理您的文本,包括标记句子、将词形还原为词根形式,以及删除停用词。
- 提取特征,这可以包括将词形还原后的标记转换为数字表示形式或生成嵌入。
- 将情感分类器应用于您的数据。
情感分析可以通过三种方式进行
- 基于规则
- 机器学习
- 混合
基于规则的情感分析使用手动编写的算法(或规则)来评估语言。这些规则使用计算语言学方法,如标记化、词形还原、词干提取和词性标记。它们也可能使用词汇表(词库)。
这种类型的分析将解析句子中的特定词语,并评估它们的极性和主观性,以确定情感和意图。一旦一个词语被赋予极性(积极、消极),基于规则的方法将计算给定文本中出现多少个积极或消极的词语,以确定其整体情感。
明显的缺点是,这种类型的系统需要大量的努力来创建所有规则。此外,这些规则没有考虑到词语在句子中的使用方式(它们的上下文)。虽然可以编写新规则来适应复杂性,但这会影响分析的整体复杂性。保持这种方法的准确性还需要定期评估和微调。
机器学习情感分析是基于规则的情感分析的自动化版本,它依赖于机器学习 (ML) 能力。此模型需要向 ML 情感分析工具提供训练数据,以便它可以学习哪些词语对应哪些极性。常见的训练数据示例包括电影评论、亚马逊产品评论或 Yelp 评级的营业场所。Hugging Face 是一个人工智能社区,提供开源库、数据集和模型,可以帮助构建和训练情感分析工具。
一旦机器学习情感分析训练完成,该过程就归结为特征提取和分类。为了产生结果,机器学习情感分析方法将依赖于不同的分类算法,如深度学习、朴素贝叶斯、线性回归或支持向量机。
混合情感分析结合了基于规则和机器学习的情感分析方法。当针对公司或用户的特定需求进行调整时,它可以是最准确的工具。当情感更加微妙时,它特别有用,例如企业对企业 (B2B) 的沟通中,消极情绪以更专业的方式表达。
情感分析的应用案例
情感分析通过识别以下内容为企业提供可操作的见解
- 所用语言的极性(是积极的、中性的还是消极的?)
- 消费者的反应的情感基调(他们是愤怒、快乐还是悲伤?)
- 语气是否紧急
- 消费者的意图或兴趣水平是什么
作为自动化意见挖掘,情感分析可以服务于多种商业目的。
评论
使用情感分析工具,企业可以收集和分析来自社交平台、博客文章以及各种讨论或评论论坛的评论、评论和提及。这是宝贵的信息,允许企业评估其品牌的感知度。
发现积极情绪可以帮助指导公司应该继续做什么,而消极情绪可以帮助识别公司应该停止和开始做什么。在这种用例中,情感分析是营销和品牌团队的有用工具。基于分析见解,他们可以调整策略,以维护和提高品牌感知度和声誉。
社交媒体监控
客户对产品或服务的反馈可能出现在互联网上的各个地方。手动和单独收集和分析这些评论效率低下。
情感分析工具可以立即检测到任何提及,并立即提醒客户服务团队。这允许公司跟踪客户的态度,进而更有效地管理他们的客户体验。情感分析工具还可以用于监控。作为品牌感知监控的扩展,情感分析可能是一种宝贵的危机预防工具。这允许团队仔细监控软件升级和新发布,以查找问题,并在出现任何问题时缩短响应时间。
市场趋势
情感分析是在进行市场研究时有用的工具,因为它允许组织对整个市场、细分市场和特定产品和服务进行广泛的审查,从态度中汲取见解,以更好地评估客户的需求和期望。
情感分析中常见的挑战
语言是一种复杂、不完美且不断发展的人类交流工具。因为情感分析依赖于语言解释,所以它本身就具有挑战性。
企业对企业的评论
理解竞争对手的评论是情感分析的一个挑战。如果一家公司设置一个规则来识别描述对其业务情绪的某些语言为积极的,那么用于描述竞争对手的相同语言也将被认为是积极的。例如
我喜欢 [贵公司] 的产品发货速度有多快。
我喜欢我可以设置 [您的竞争对手] 的发货窗口。
这两句话都是积极的,但情感分析工具不会区分公司及其竞争对手,除非它经过训练,可以将任何关于竞争对手的积极评价识别为消极的。
讽刺、挖苦和语境
检测和理解面对面讽刺和挖苦的挑战也延伸到了情感分析。挖苦使用积极的词语来描述消极的情绪,问题是通常没有文本线索让机器区分真诚与挖苦或讽刺。例如,在回答“你喜欢橙汁中的果肉吗?”时,“天哪,你肯定”可以理解为积极的(如果作者是真诚的),或者消极的(如果作者是挖苦的)。
语境也会扭曲情感。考虑以下两个回复
“只有一点点。”
“很多!”
如果评论是针对“您有多大可能推荐此产品?”之类的问题,则第一个回复被认为是消极的,而第二个回复是积极的。但是,如果提示是“价格调整对您造成了多大的困扰?”,则极性会颠倒。
文化差异
特定文化的语言使用是情感分析的主要挑战之一。考虑一下不同文化之间的幽默差异有多大。即使在英语中,方言差异也会使区分意义变得复杂。例如
“Pants”在美国英语中指的是长裤。在英国,“pants”指的是内衣。
这种差异会影响分析的准确性。习语也因文化而异。它们的分析也面临类似的挑战。
主观性
情感分析的主要挑战之一是语言是主观的。这使得分类成整齐的类别、方面或极性变得复杂。考虑以下示例
“这部手机很棒” 明确表示积极的情绪。
“这部手机很小” 更难分类。根据作者对大小的感受,它可能是积极的、中性的或消极的陈述。
由于上下文、讽刺或挖苦的使用以及其他言语特性,给定词语的含义可能是主观的。
情感分析的优点
情感分析通过可操作的见解为用户带来好处。作为一种工具,它的优点是多方面的
将客户情绪转化为可操作的实时信息
情感分析工具可以帮助防止不满和客户流失,甚至可以找到那些会拥护您的产品或服务的客户。该工具可以分析调查或客户服务互动,以确定哪些客户是推广者或拥护者。相反,情感分析还可以帮助识别不满意的客户,他们对产品和服务的响应提供了有关改进领域的宝贵见解。
大规模挖掘文本中的客户情绪
情感分析工具提供实时分析,这对于危机的预防和管理至关重要。在问题出现后立即收到警报,并领先于即将发生的危机。作为意见挖掘工具,情感分析还为公关团队提供了宝贵的见解,以制定策略并管理持续的危机。
改善客户服务
情感分析工具同时从各种来源提取广泛的数据:电子邮件、推文、评论、调查、投票和评论。文本分析工具可以通过授权管理人员培训处理难缠客户的客户服务倡导者,帮助更好地管理客户服务运营,并优先处理查询和自动化跟踪不良互动。
情感分析的常用方法
情感分析有几种方法。您可以自己构建一个,购买云提供商的附加组件,或投资现成的情感分析工具。各种软件即服务 (SaaS) 情感分析工具可用,而像 Python 或 Java 这样的开源库可用于构建您自己的工具。或者,云提供商提供他们自己的人工智能套件。
构建您自己的情感模型
您可以使用 NLP 库(如 spaCy 或 NLTK)构建自己的情感模型。对于那些过于雄心勃勃的人来说,您甚至可以从头开始构建!使用 Python 或 Javascript 进行情感分析可以为您提供更多的自定义控制。虽然自定义的好处很重要,但在做出决定时应考虑构建自己的工具所需的成本和时间。
使用统包情感分析产品
您也可以购买现成的解决方案,例如标准云提供商提供的 SaaS 产品。这可能包括 Amazon Comprehend、Google AI 和机器学习产品,或 Azure 的认知服务。SaaS 情感分析工具的优势在于它可以快速部署,而且通常成本仅为定制工具的一小部分。该工具的训练过程已得到简化,并且不需要整个工程师和专家团队进行设置。
集成第三方情感分析
通过像 Elastic 这样的第三方解决方案,您可以将自己或公开可用的情感模型上传到 Elastic 平台。然后,您可以实现分析存储在 Elastic 中的文本数据的情感应用程序。
云提供商 AI 套件
云提供商还将情感分析工具作为其 AI 套件的一部分提供。选项包括 Google AI 和机器学习产品,或 Azure 的认知服务。
随着 AI 技术的学习和改进,情感分析的方法也在不断发展。成功的情感分析方法需要不断调整训练模型,或频繁更新购买的软件。
开始使用 Elastic 进行情感分析
使用 Elastic 启动您的情感分析工具,这样您就可以执行自己的观点挖掘,并获得您需要的可操作的见解。
情感分析词汇表
算法:计算机遵循的过程或一组规则。
人工智能:机器和计算机系统对人类智能的模拟。
计算语言学:语言学的一个分支,它使用计算机科学理论来分析和综合语言和语音。
共指消解:识别文本中属于命名实体的所有单词的过程。
词形还原:将同一单词的不同屈折形式组合在一起的过程。
词汇:一种语言的词汇单词清单。
机器学习:人工智能的一个子集,它通过使用数据和算法,使计算机无需提示即可进行学习。
命名实体识别:将单词识别为专有名词或实体的过程
自然语言处理:计算机科学的一个分支,作为人工智能的一个子集,致力于帮助计算机系统理解人类语言。
词性标注:在文本中标记一个单词以分类它属于哪个词性的过程(例如,apple = 名词;slowly = 副词;closed = 形容词)。
词干提取:将单词简化为词干或词根形式的过程。
分词:将一段文本分成较小的单元(称为标记)的过程。
词义消歧:根据单词在上下文中的使用来识别词义的过程。