什么是搜索相关性?
搜索相关性定义
搜索相关性衡量的是搜索引擎提供的搜索结果与用户查询和意图的匹配程度。搜索结果的质量可以通过显示的信息与用户期望的匹配程度来确定。
提高搜索相关性和性能涉及语言分析、排名算法和上下文因素。这些因素可能包括用户行为分析、位置数据、流行度和搜索历史记录。搜索相关性是客户体验的一个重要因素,通过适当的平衡,可以优化搜索以满足企业及其用户的需求。
了解相关性为何对搜索引擎如此重要,以及如何使用 Elasticsearch 实现最佳相关性排名功能。此视频重点介绍了构建现代搜索应用程序如何帮助最终用户实时找到相关结果。
搜索相关性算法
搜索相关性由复杂的算法提供支持,这些算法可以评估、处理、检索和排名信息。搜索相关性算法可以解码关键字和意图的语义,评估来源的权威性,并解码参与度、地理位置和个人偏好等信号。
常见的搜索相关算法包括
TF-IDF(词频-逆文档频率)用于评估关键字的重要性,奖励在目标文档中频繁出现但在其他文档中不常见的词语。
RankBrain是 Google 开发的一种 AI 驱动的算法,它使用机器学习来解释和处理查询,以便更好地理解用户的意图,而用户的意图通常是微妙或模糊的。
向量空间模型通过将文档和查询表示为维度空间中的向量来工作,从而实现比较和排名。
潜在语义分析使用统计方法来处理相关的单词和短语,从而识别词语之间的潜在关系。
自然语言处理 (NLP)是一种机器学习技术,它允许搜索引擎更好地理解搜索中使用的人类语言的上下文和语义。
搜索相关性的关键因素
搜索相关性的关键因素包括从关键字密度到参与度指标的各种信号。搜索引擎会抓取内容和链接,收集和索引数据,并根据大量标准为每个页面分配相关性、评分、排序和排名结果。然后,它们必须剖析关键字和语音的上下文,以提供搜索者实际想要查找的内容。
搜索相关性的关键因素包括
- 文本分析和关键字相关性
将查询词语与文章、页面、文档和产品列表的内容相匹配的过程对于建立相关性至关重要。自然语言短语的复杂性、同义词、词语变体、拼写错误、区域拼写变体和语音拼写等等,都使这项任务变得复杂。 - 内容质量
权威内容往往会根据其对可信度和准确性的评估而排名更高。新鲜度也起着一定的作用,对于某些查询,更新的内容被认为更相关。 - 词语权重
在确定哪些关键字应该优先考虑时,会为每个词语分配数值,这些数值对于结果的准确性至关重要。 - 用户意图
算法有助于确定用户的真实目标,解决显式搜索查询及其背后的语义上下文。 - 个性化和本地化
上下文相关性允许搜索引擎根据用户特定的因素(包括地理位置、语言、设备类型以及浏览和搜索历史记录)来定制结果。 - 用户参与度指标
点击率有助于衡量用户参与度。没有结果的搜索和/或没有点击的搜索可以洞察用户对搜索结果的满意度。
为什么搜索相关性很重要?
搜索相关性对用户满意度至关重要。当用户能够快速有效地找到他们需要的信息时,他们的体验会得到极大改善。根据您业务的不同,这可能意味着将更多购物者转化为客户,将更多随意浏览者转化为忠实读者或消费者,或者让更多团队成员能够完成任务并做出重要决策。
43% 的用户1 在浏览网站时会直接使用搜索栏,并且他们的转化率是非搜索用户的 3 倍。43% 的用户1 在浏览网站时会直接使用搜索栏,并且他们的转化率是非搜索用户的 3 倍。对于企业而言,搜索通常是与潜在客户或客户互动的第一点。因此,它对于建立用户信任、参与度和收入至关重要。在内部,简化相关信息的传递可以节省时间和精力。
糟糕的搜索相关性会导致用户感到沮丧,并可能放弃网站,转而通过其他渠道进行查询,而且永远不会再回来。对于在线零售商而言,这意味着失去找不到所需产品的购物者。相关结果可以转化为更高的转化率和更高的收入。在线零售商还可以从搜索驱动的电子商务体验中获益,这些体验可以增加购物车大小,例如“购物者还购买了”或“类似商品”选项卡。
对于制作内容的企业而言,更高的搜索相关性意味着更高的知名度和更广泛的受众范围。对于研究人员、医生、学生和专业人士而言,准确的结果可以带来更好的工作成果。
如何评估和衡量搜索相关性
每个搜索者的需求和意图都不同。准确或系统地衡量相关性具有挑战性。行业基准提供了一些指导,例如 Benchmarking-IR (BEIR),它是一个预先训练的转换器,用于在排名系统上评估信息检索方法。例如,MS-MARCO(微软机器阅读理解)是 BEIR 基准测试的一部分,它有一个问答数据集来评估搜索的有效性。虽然这提供了一个搜索相关性的指标,但没有绝对的评分方法。
了解搜索效果如何的一种方法是寻找用户行为趋势,并不断寻求逐步改进的方法。
搜索效率可以通过用户找到正确信息所需的输入、重新输入和修改搜索词的次数来衡量。搜索效率由用户为找到所需信息而付出的总体努力来定义。两者都为了解整体搜索相关性提供了一个窗口。搜索分析还可以提供有关用户搜索频率、搜索内容以及是否找到所需内容的见解。
召回率是指检索到的相关记录数与相关记录总数之比。精确率是指相关结果数与不相关和相关记录总数之比。虽然召回率和精确率是关键指标,但它们通常需要一定程度的人工评估和监督才能进行评估,这可能会很昂贵。通过调查或交互式按钮收集用户反馈可以以较低的成本了解用户如何看待搜索结果的相关性。
搜索者行为指标提供了间接但隐含的相关性判断。一个有价值的量化指标是点击率 (CTR),它衡量的是用户在查看结果后点击结果的百分比。点击率越高,相关性越大。停留时间,即用户点击搜索结果链接后在页面上停留的时间,是另一个关键指标,停留时间越长,表示内容越相关、质量越高。另一方面,离开页面而不进行任何交互的用户百分比(称为跳出率)可能表明内容未达到预期。
提高搜索相关性的技巧
提高搜索相关性是一个持续的过程。除了采用最新的机器学习算法、自然语言处理能力和实体识别外,以下是一些随着时间的推移提高搜索相关性的技巧
- 扩展查询理解
要扩大结果范围,请扩展与定义和范围相关的术语或关键字同义词的查询理解,关键字同义词是指与搜索词含义相同或相似的词或短语。还可以扩展到包含部分匹配结果,如果查询的某些部分(如果不是全部)匹配,则匹配这些部分。自动语言检测还可以用于建议与之前搜索类似的文本。 - 提高拼写容错能力
改进的拼写容错能力意味着即使拼错单词,用户仍然可以获得所需的结果。拼写容错使搜索更加顺畅,因为用户不必重新输入查询。不要依赖完全匹配,而是通过改进自动更正和拼写检查功能来提高对拼写错误和拼写错误的容忍度。您还可以使用“您是不是要查找”功能建议替代方案和更正搜索词。 - 合并方面和过滤器
方面(也称为智能过滤器)可帮助用户缩小搜索范围。方面和过滤器在信息量大的网站上最有用。自动检测过滤器或使用户能够根据相关属性(如位置、主题、价格、类别和日期)缩小搜索结果范围。 - 拥抱个性化
根据用户偏好、位置、搜索和购买历史记录以及行为自定义结果可以提高相关性。通过对最相关的搜索结果进行排名来为用户定制结果。个性化也是预测性搜索的关键部分,可以使用户过去的搜索来预测他们未来的需求。 - 利用用户反馈
鼓励用户提供有关结果质量的反馈有助于搜索引擎学习和改进。用户反馈是衡量搜索实际相关性的最佳指标。利用反馈可以让您的搜索引擎不断改进。 - 优化用户体验
通过删除过时的页面、重复的内容、未使用的关键字或标签以及断开的链接来清理您的网站。简化用户体验设计,例如让搜索栏易于查找且使用直观。构建您的网站结构,以确保搜索引擎能够更有效地抓取您的内容并为其编制索引。 - 优先考虑高价值网站区域
要向用户展示最有价值的内容,请提高网站质量内容区域结果的权重,包括参与度、权威性、反向链接和转化率最高的页面。
搜索相关性方面的挑战和局限性
与低质量的搜索结果作斗争可能是一个令人沮丧的过程,而且解决方案并不总是透明的。解释具有多种含义的查询总是存在歧义。在没有太多其他依据的情况下破译真实意图是一门不完美的科学。真正相关的搜索是一个认知迷宫,即使是最先进的人工智能也尚未解决。
为了保持最新状态,搜索引擎必须快速适应全球每秒生成的海量内容,这些内容来自语言、方言、俚语和地区差异的多样化和不断变化的环境。尽管个性化搜索结果对相关性有很大贡献,但它们也可能造成信息茧房,限制用户接触不同观点的机会。
对于组织而言,优化搜索相关性通常会让人感到困惑。为用户提供相关搜索结果的时间窗口似乎总是越来越小。
搜索相关性的未来趋势
目前,有一些先进的搜索技术可以帮助在搜索相关性方面取得重大进展。
语义搜索可以解释用户查询的含义,它使用上下文来响应用户的意图,而不是逐字逐句地搜索。向量搜索通常用于语义搜索,它使用近似最近邻 (ANN) 算法查找相似的数据,以产生更相关的结果。混合搜索结合使用支持向量的搜索方法和关键字搜索方法。
随着这些搜索类型的演变,搜索相关性指标也将发生变化,以适应其影响。其他技术创新也将影响搜索相关性的未来。
在几乎所有文化和企业领域,人工智能驱动的搜索引擎都有望在组织人工干预少得多的情况下,极大地提高搜索相关性。人工智能将实现自动同义词检测、从指标和反馈中自我学习的排名算法,以及可以预测客户需求的实时用户活动跟踪等功能,甚至在他们提出要求之前。
在电子商务领域,能够处理图像和视频视觉信息的智能多语言搜索栏将彻底改变购物方式,它能够建议客户真正想要的颜色、品牌和尺寸完全相同的商品,从而省去数小时的滚动浏览时间。准确的语音搜索将会激增。生成式人工智能的准确性越来越高,它将对查询生成高度相关的上下文答案,并提供具体的、更有帮助的建议,而不是结果列表。机器学习已经为搜索相关性开辟了一个广阔的新领域.
深入了解 2024 年技术搜索趋势。观看此网络研讨会,了解最佳实践、新兴方法以及 2024 年影响开发人员的首要趋势。
使用 Elasticsearch 实现搜索相关性
Elasticsearch 相关性引擎可帮助用户准确找到他们需要的内容,从而通过最先进的机器学习提供高度相关、个性化的人工智能驱动搜索体验。
我们全面的拖放式相关性调整工具还允许您分析、优化和个性化,以提供更精确的结果。借助自适应相关性,您可以根据搜索分析,通过基于数据的自动推荐,让效果最佳的结果排名靠前。您还可以通过生成式人工智能、向量搜索、对 NLP 转换器模型的支持以及第三方模型管理来提高语义相关性。
探索更多搜索相关性资源
您接下来应该做什么
无论您何时准备好了……我们都可以通过以下四种方式帮助您从业务数据中获取洞察力
- 开始免费试用,了解 Elastic 如何帮助您的企业。
- 浏览我们的解决方案,了解 Elasticsearch 平台的工作原理,以及我们的解决方案如何满足您的需求。
- 参加我们 45 分钟的网络研讨会,了解如何设置您的 Elasticsearch 集群,并开始进行数据收集和提取。
- 与您认识的喜欢阅读本文的人分享这篇文章。您可以通过电子邮件、领英、推特或脸书与他们分享。
搜索相关性常见问题解答
如何调整搜索相关性?
搜索相关性可以在查询级别或索引级别进行调整。允许更广泛的查询理解可以帮助产生更好的结果。在索引级别,您可以通过使用更多数据集训练模型来微调搜索相关性。
个性化如何影响搜索相关性?
个性化可以根据个人用户的偏好、行为和地理位置定制搜索结果,从而提高提供满足其期望且与其相关且有意义的内容的可能性。
脚注
1 来自“必备电子商务功能”,Forrester,Sucharita Kodali 和 Scott Compton,2022 年 2 月 18 日,https://www.forrester.com/report/MustHave-eCommerce-Features/RES89561