主页
Think
主题
推荐引擎
发布日期:2024 年 6 月 19 日
作者:Rina Caballar、Cole Stryker
推荐引擎可帮助用户发现他们自己可能找不到的内容、产品或服务。许多网络公司(包括电子商务网站、流媒体平台、搜索引擎和社交媒体网络)在创造销售额和培养用户粘性方面都离不开这些系统。
推荐系统可以推荐下一部要观看的电影或视频、一首相似歌曲或相关搜索结果,还可以推荐凑单产品。
推荐系统提出的建议在个性化用户体验方面也发挥着重要作用。根据管理咨询公司麦肯锡的研究(链接位于 ibm.com 以外),个性化可以将收入提高 5% 至 15%。 此外,76% 的客户在没有体验 到个性化互动时会 感到沮丧 。
推荐系统的市场正在不断扩大。2024 年,推荐引擎市场(链接位于 ibm.com 以外)规模预计将达到 68.8 亿美元,预计 5 年内市场规模将增长两倍。
了解支持基础模型定制的 AI 平台有哪些优势。
为了向目标用户提供合适的建议,推荐引擎融合了 数据科学 和机器学习。
推荐器通常分 5 个阶段运行,以预测最准确的推荐:
数据是推荐系统的基础,因此收集数据是至关重要的第一步。要收集的两类关键数据包括显式数据和隐式数据。
显性数据包括用户的行动和活动,如评论、点赞、评分和评论。隐性数据包括用户行为,如浏览历史记录、购物车事件、点击、过去的购买和搜索历史记录。
推荐系统还会使用人口统计数据(年龄或性别)、心理统计数据(兴趣或生活方式))等其他客户数据来查找相似用户,并使用特征数据(例如价格范围或商品类型)来确定相关产品或服务。
分析阶段采用机器学习算法来处理和检查数据集。这些算法可以检测模式、识别相关性并权衡这些模式和相关性的强度。机器学习模型可以在大型数据集上进行训练,以提出合适的建议。
最后一步是筛选数据,显示上一个分析阶段中最相关的商品。数据筛选包括对数据应用某些数学规则和公式,具体取决于所使用的推荐引擎类型。
可以添加可选的优化步骤来定期评估推荐系统的输出,进一步优化模型,不断提高其准确性和质量。
推荐系统根据其使用的过滤方法而有所不同。推荐引擎一般有 3 种类型:
协同过滤系统根据特定用户与其他用户的相似度来过滤推荐。协同推荐系统依赖于显式数据和隐式数据,假设具有相似偏好的用户可能会对同款商品感兴趣,并且未来可能会以类似的方式与这些商品交互。
例如,亚马逊(链接位于 ibm.com 以外)在其产品推荐中使用了协同筛选技术, 就像 Spotify(链接位于 ibm.com 以外)在其音频内容中使用的一样。
协同过滤推荐系统可以提供有效建议,并且通常不需要详细商品描述。然而,协同过滤也容易出现冷启动问题,当系统可供参考的历史数据有限时,尤其是对于新用户而言,就会发生这种情况。
协同筛选系统主要有两种:基于记忆的和基于模型的。
基于内存的系统以矩阵形式表示用户和商品。它们是 K 最近邻算法 (KNN) 的扩展,因为它们的目标是找到“最近邻居”,这些邻居可以是相似的用户,也可以是相似的商品。基于内存的系统又可细分为两种类型:
另一方面,基于模型的系统会创建数据的机器学习预测模型。将用户-商品矩阵作为模型的训练数据集,然后对缺失值(即用户尚未找到因此会被推荐的商品)进行预测。
矩阵因式分解是最常用的基于模型的协同筛选算法之一。这种降维方法通常会将庞大的用户-商品矩阵分解成两个较小的矩阵,一个是用户矩阵,另一个是商品矩阵。然后将这两个矩阵相乘,以预测较大矩阵中的缺失值(或建议值)。
更高级的矩阵因式分解实现方法是利用深度学习 Neural Networks。其他基于模型的系统则采用机器学习算法,例如,贝叶斯分类器、聚类分析和 Decision Trees。
基于内容的过滤系统根据商品特征来过滤推荐商品。如果用户喜欢某个特定商品,基于内容的推荐系统会假设他们也会喜欢另一款相似商品。基于内容的过滤会考虑商品描述,例如颜色、类别、价格和由关键字和标签分配的其他元数据,以及显式和隐式数据。
基于内容的过滤系统将商品和用户表示为向量空间中的向量。采用接近度来判断商品之间的相似度如何。两个向量在空间中越接近,相似度就越高。根据所提供的特征,系统会向用户推荐与之前的商品相似的向量。
基于内容的推荐系统采用的是基于用户的分类器或回归模型。将用户感兴趣的商品描述和特征用作模型的训练数据集,然后生成推荐商品预测。
通过使用自然语言处理标签,基于内容的推荐系统可以得到进一步改进。但是,对于海量数据来说,这种标记过程可能比较繁琐。
与协同过滤不同,冷启动问题不是什么大问题,因为基于内容的过滤依据是元数据特征,而不是过去的用户交互。但是,基于内容的过滤在搜索新商品时可能存在局限,因为其推荐的商品通常与用户之前喜欢的类似。
顾名思义,混合推荐系统融合了协同筛选和基于内容的筛选。
因此,混合方法可以大大提高推荐引擎的性能,但需要先进的架构和强大的计算能力。
例如,Netflix 使用混合推荐系统(链接位于 ibm.com 以外)来推荐电影和电视节目。
推荐引擎可以为企业和用户带来价值。组织通过投资推荐系统可以获得的以下优势:
推荐合适的产品或服务可以为用户节省时间,避免无休止地浏览大量目录。例如,Netflix 上观众观看的内容有 80% 来自推荐算法所推荐的内容。此外,推荐相关内容可以带来个性化体验。
根据麦肯锡的研究,增强客户体验(链接位于 ibm.com 以外)可提高客户满意度,确切地说,可提高 20%。 满意的客户会变得更加积极,对品牌更加忠诚,从而助力企业建立信任并留住更多客户。
提供个性化推荐可鼓励用户浏览和点击更多商品,最终可能将浏览者转化为购买者。麦肯锡发现,更积极、更个性化的客户体验可将销售转化率提高 10% 至 15%。
客户转化率推动销售,销售推动收入。麦肯锡指出,购物者在亚马逊上购买的商品中有 35% 来自产品推荐(链接位于 ibm.com 以外)。 与此同时,Netflix 预计其推荐系统可节省超过 10 亿美元。
推荐系统有其局限性,并给组织带来挑战。以下是最常见的几种情况:
推荐引擎需要分析和筛选海量数据。这需要复杂的架构和大量的计算资源投资。
推荐系统必须足够快,以便实时确定和显示正确的推荐。如果要向成百上千的用户同时提供实时建议,这就变得更加困难,更不用说数以百万计的用户了。
围绕错误的指标优化机器学习算法可能会导致不相关的推荐。经常获得较高评价的商品可能会比新的、生僻的或评论较少的商品被更频繁地推荐。但是,最受欢迎或购买最多的商品可能并不是客户感兴趣的商品。
机器学习算法可能会学习数据中存在的社会偏见——无论是收集的数据、标记的数据、训练数据还是外部数据源——或者从调整模型的人类评估者那里。这可能导致建议不准确。
出于隐私考虑,一些用户可能会选择不参与企业的推荐系统数据收集计划。企业在收集和存储数据时可能还需要考虑监管要求和合规标准。
以下是企业使用推荐系统的一些方法。随着推荐技术的发展,还可能出现其他用例和应用程序。
零售商和在线卖家可以使用推荐引擎来提高销量。推荐系统可以向顾客推荐其他人购买过的商品,或者可以很好地搭配已购商品的产品。
推荐系统可用于基于位置或季节的推荐,也可用于推广新产品或打折商品。这些系统还可用于扩大很少购买的商品的覆盖范围,将其作为捆绑商品或经常购买的商品与更受欢迎的商品一起推荐。
亚马逊是电商公司使用推荐引擎的典型例子。
根据历史数据和用户偏好,推荐系统可以向用户推荐他们可能参与和喜欢的相关内容。
无论是要看的下一部电视剧、要读的电子书、要听的歌手、要玩的游戏还是要参加的音乐会,这些系统都能提供个性化推荐,以此提升用户体验。
Netflix、Spotify 和 YouTube 等媒体和娱乐公司都在使用推荐器。
在旅游和酒店领域,推荐引擎可以根据个人的预算和旅游经历,推荐酒店和住宿选择、餐厅、活动和体验。
这些个性化的旅行推荐可满足旅行者的需求,从而提高客户满意度。
企业可以利用推荐引擎来扩大合格线索。推荐人可以推荐博客文章、成功案例、网络研讨会或白皮书等内容,以介绍新服务并吸引潜在客户。
然后,营销团队就可以通过通讯、社交媒体广告和有针对性的电子邮件传达这些建议。
AIOps(即面向 IT 运营的人工智能)应用 AI 来自动执行并简化 IT 服务管理和运营工作流。
在 AIOps 中可使用推荐引擎来提出解决方案,助力 IT 运营团队迅速采取行动并适当应对技术问题。
轻松训练、验证、调整和部署生成式 AI、基础模型和机器学习功能,并在短时间内使用少量数据构建 AI 应用程序。IBM watsonx.ai 将由基础模型提供支持的全新生成式 AI 功能和传统机器学习整合到一个跨越 AI 生命周期的强大开发平台中。
利用由各种库、服务和应用程序构成的强大而灵活的产品组合,加速实现 AI 的商业价值。
设计一项数据战略,消除数据孤岛,降低复杂性并提高数据质量,以实现卓越的客户和员工体验。
使用基于 Data Fabric 架构构建的平台,更快地预测结果。无论数据存储在何处,都能够采集、整理和分析数据。
使用 IBM Watson Knowledge Studio 为特定领域创建定制的语言分析模型。
在此成功案例中介绍实现推荐系统的真实示例。
了解 IBM Case Manager 如何通过使用 IBM Watson Machine Learning、IBM Watson Visual Recognition 和 IBM Watson OpenScale,使用 AI 推荐模型来检查保险理赔的有效性。
深入了解机器学习在现实世界中的一些应用,这些应用已成为我们日常生活的一部分。
了解什么是预测分析以及其优势、类型和用例。
深入了解现代数据平台如何对组织的数据进行转换和分析,以帮助改进决策。