推荐算法之潜在因子(LatentFactor)算法

作者：apiaoapiao_622 | 来源：互联网 | 2023-07-25 17:13

缘起：在阅读Facebook论文DLRM时，涉及到了潜在因子（LF）算法，通过查询阅读有了初步了解ÿ

缘起&＃xff1a;

在阅读Facebook论文DLRM时&＃xff0c;涉及到了潜在因子&＃xff08;LF&＃xff09;算法&＃xff0c;通过查询阅读有了初步了解&＃xff1a;通过对稀疏矩阵&＃xff08;稀疏的原因是有未知值&＃xff09;R进行uv分解&＃xff0c;得到u、v矩阵&＃xff0c;再通过u\v中向量乘积估计R矩阵中未知值。下面转载通俗易懂的知乎帖&＃xff0c;并对帖子中没有说清楚的部分进行了补充并以粗体形式标记。
原帖标题&＃xff1a;
网易云音乐的歌单推荐算法是怎样的&＃xff1f;
回答内容&＃xff1a;
这里我想给大家介绍另外一种推荐系统&＃xff0c;这种算法叫做潜在因子&＃xff08;Latent
Factor&＃xff09;算法。这种算法是在NetFlix&＃xff08;没错&＃xff0c;就是用大数据捧火《纸牌屋》的那家公司&＃xff09;的推荐算法竞赛中获奖的算法&＃xff0c;最早被应用于电影推荐中。这种算法在实际应用中比现在排名第一的 &＃64;邰原朗所介绍的算法误差&＃xff08;RMSE&＃xff09;会小不少&＃xff0c;效率更高。我下面仅利用基础的矩阵知识来介绍下这种算法。
算法的思想是这样&＃xff1a;每个用户&＃xff08;user&＃xff09;都有自己的偏好&＃xff0c;比如A喜欢带有小清新的、吉他伴奏的、王菲等元素&＃xff08;latent factor&＃xff09;&＃xff0c;如果一首歌&＃xff08;item&＃xff09;带有这些元素&＃xff0c;那么就将这首歌推荐给该用户&＃xff0c;也就是用元素去连接用户和音乐。每个人对不同的元素偏好不同&＃xff0c;而每首歌包含的元素也不一样。我们希望能找到这样两个矩阵&＃xff1a;
一&＃xff0c;用户-潜在因子矩阵Q&＃xff0c;表示不同的用户对于不用元素的偏好程度&＃xff0c;1代表很喜欢&＃xff0c;0代表不喜欢。比如下面这样&＃xff1a;

二&＃xff0c;潜在因子-音乐矩阵P&＃xff0c;表示每种音乐含有各种元素的成分&＃xff0c;比如下表中&＃xff0c;音乐A是一个偏小清新的音乐&＃xff0c;含有小清新这个Latent Factor的成分是0.9&＃xff0c;重口味的成分是0.1&＃xff0c;优雅的成分是0.2……
在这里插入图片描述
利用这两个矩阵&＃xff0c;我们能得出张三对音乐A的喜欢程度是&＃xff1a;张三对小清新的偏好音乐A含有小清新的成分&＃43;对重口味的偏好音乐A含有重口味的成分&＃43;对优雅的偏好音乐A含有优雅的成分&＃43;……

即&＃xff1a;0.60.9&＃43;0.80.1&＃43;0.10.2&＃43;0.10.4&＃43;0.70&＃61;0.69
每个用户对每首歌都这样计算可以得到不同用户对不同歌曲的评分矩阵 $R~\widetilde{R}$

。&＃xff08;注&＃xff0c;这里的破浪线表示的是估计的评分&＃xff0c;接下来我们还会用到不带波浪线的 $R$ 表示实际的评分&＃xff09;&＃xff1a;
在这里插入图片描述
因此我们队张三推荐四首歌中得分最高的B&＃xff0c;对李四推荐得分最高的C&＃xff0c;王五推荐B。

如果用矩阵表示即为&＃xff1a;
$R~&＃61;QPT\widetilde{R}&＃61;QP^T$

&＃61;QPT

我们所说的“潜在因子”指的就是以上例子中的 $Q$ 和 $P^T$ 矩阵&＃xff0c;那么
下面问题来了&＃xff0c;以上的潜在因子&＃xff08;latent factor&＃xff09;是怎么得到的呢&＃xff1f;由于面对海量的让用户自己给音乐分类并告诉我们自己的偏好系数显然是不现实的&＃xff0c;事实上我们能获得的数据只有用户行为数据。我们沿用 &＃64;邰原朗的量化标准&＃xff1a;单曲循环&＃61;5, 分享&＃61;4, 收藏&＃61;3, 主动播放&＃61;2 , 听完&＃61;1, 跳过&＃61;-2 , 拉黑&＃61;-5&＃xff0c;在分析时能获得的实际评分矩阵R&＃xff0c;也就是输入矩阵大概是这个样子&＃xff1a;
在这里插入图片描述
事实上这是个非常非常稀疏的矩阵&＃xff0c;因为大部分用户只听过全部音乐中很少一部分。如何利用这个矩阵去找潜在因子呢&＃xff1f;这里主要应用到的是矩阵的UV分解&＃xff08;即将矩阵 $R$ 通过矩阵UV分解分解成矩阵 $Q$ 、 $P^T$ 的矩阵乘积&＃xff0c;这里 $Q$ 、 $P^T$ 的乘积记为 $R~\widetilde{R}$

只是矩阵 $R$ 的近似&＃xff09;。也就是将上面的评分矩阵分解为两个低维度的矩阵&＃xff0c;用Q和P两个矩阵的乘积去估计实际的评分矩阵&＃xff0c;而且我们希望估计的评分矩阵 $R~\widetilde{R}$

在这里插入图片描述
和实际的评分矩阵不要相差太多&＃xff08;指的是与矩阵 $R$ 非缺失值部分值接近&＃xff09;&＃xff0c;也就是求解下面的目标函数&＃xff1a;

这里涉及到最优化理论&＃xff0c;在实际应用中&＃xff0c;往往还要在后面加上2范数的罚项&＃xff0c;然后利用梯度下降法就可以求得这P,Q两个矩阵的估计值。这里我们就不展开说了。例如我们上面给出的那个例子可以分解成为这样两个矩阵&＃xff1a;
在这里插入图片描述
这两个矩阵相乘就可以得到估计的得分矩阵&＃xff1a;

将用户已经听过的音乐剔除后&＃xff0c;选择分数最高音乐的推荐给用户即可&＃xff08;红体字&＃xff09;。

在这个例子里面用户7和用户8有强的相似性&＃xff1a;
在这里插入图片描述
从推荐的结果来看&＃xff0c;正好推荐的是对方评分较高的音乐&＃xff1a;

在这里插入图片描述

推荐阅读

facebook
图像标签与以图搜图技术的应用与实践

本文探讨了图像标签的多种分类场景及其在以图搜图技术中的应用，涵盖了从基础理论到实际项目实施的全面解析。 ... [详细]

蜡笔小新 2024-12-07 14:28:06
facebook
图像分类算法的优化策略与实践

本文探讨了《Bag of Tricks for Image Classification with Convolutional Neural Networks》论文中的多项技术，旨在通过具体实例和实验验证，提高卷积神经网络在图像分类任务中的性能。文章详细介绍了从模型训练加速、网络结构调整到训练参数优化等多个方面的改进方法。 ... [详细]

蜡笔小新 2024-12-09 16:01:40
facebook
深入解析Redis内存对象模型

本文详细介绍了Redis内存对象模型的关键知识点，包括内存统计、内存分配、数据存储细节及优化策略。通过实际案例和专业分析，帮助读者全面理解Redis内存管理机制。 ... [详细]

蜡笔小新 2024-12-23 14:50:23
支付宝
阿里Java面试全解析：从技术面到HR面的详细攻略

本文作者分享了在阿里巴巴获得实习offer的经历，包括五轮面试的详细内容和经验总结。其中四轮为技术面试，一轮为HR面试，涵盖了大量的Java技术和项目实践经验。 ... [详细]

蜡笔小新 2024-12-23 11:32:02
支付宝
深入理解HashCode与Equals方法

本文详细解析了Java中hashCode()和equals()方法的实现原理及其在哈希表结构中的应用，探讨了两者之间的关系及其实现时需要注意的问题。 ... [详细]

蜡笔小新 2024-12-23 02:59:15
支付宝
Redux入门指南

本文介绍Redux的基本概念和工作原理，帮助初学者理解如何使用Redux管理应用程序的状态。Redux是一个用于JavaScript应用的状态管理库，特别适用于React项目。 ... [详细]

蜡笔小新 2024-12-22 10:04:31
facebook
2017年人工智能领域的十大里程碑事件回顾

随着2018年的临近，我们一同回顾过去一年中人工智能领域的重要进展。这一年，无论是政策层面的支持，还是技术上的突破，都显示了人工智能发展的迅猛势头。以下是精选的2017年人工智能领域最具影响力的事件。 ... [详细]

蜡笔小新 2024-12-16 17:59:16
facebook
a16z 推出加密研究实验室

a16z 宣布成立全新的加密研究实验室，旨在推动加密技术和 Web3 领域的科学发展。 ... [详细]

蜡笔小新 2024-12-11 10:17:03
facebook
大数据时代的机器学习：人工特征工程与线性模型的局限

本文探讨了在大数据背景下，人工特征工程与线性模型的应用及其局限性。随着数据量的激增和技术的进步，传统的特征工程方法面临挑战，文章提出了未来发展的可能方向。 ... [详细]

蜡笔小新 2024-12-07 11:58:58
facebook
利用神经网络破解数学难题：求解偏微分方程的新途径

一项来自Quantamagazine的最新研究揭示，借助人工智能的深度学习技术，特别是深度神经网络，科学家们能够在数学建模领域取得突破，显著提高了处理复杂系统中偏微分方程的速度与效率。 ... [详细]

蜡笔小新 2024-12-01 14:44:13
facebook
实现页面自动加载更多内容功能：类微博和Pinterest的设计

在现代Web应用中，当用户滚动到页面底部时，自动加载更多内容的功能变得越来越普遍。这种无刷新加载技术不仅提升了用户体验，还优化了页面性能。本文将探讨如何实现这一功能，并介绍一些实际应用案例。 ... [详细]

蜡笔小新 2024-12-23 17:01:04
facebook
有C和C++基础，如何提高面向对象的类的设计能力？

编写了几个500行左右代码的程序，但基本上解决问题还是面向过程的思维，如何从问题中抽象出类，形成类的划分和设计，从而用面向对象的思维解决问题？有这方面的入门好书吗？最好是结合几个具体的案例分析的 ... [详细]

蜡笔小新 2024-12-22 19:50:43
facebook
SaltStack部署实践（4）JOB管理与Returns模块

目录一、salt-job管理#job存放数据目录#缓存时间设置#Others二、returns模块配置job数据入库#配置returns返回值信息#mysql安全设置#创建模块相关 ... [详细]

蜡笔小新 2024-12-22 18:53:43
facebook
自定义CSS样式打造个性化HTML5视频播放器

本文详细介绍如何使用CSS自定义HTML5视频播放器的样式，涵盖常见属性及跨浏览器兼容性问题。发布时间：2020-09-14 14:46:29；来源：亿速云；阅读量：58；作者：小新。 ... [详细]

蜡笔小新 2024-12-22 18:36:22
facebook
点击菜单栏时同时触发外部点击事件

探讨如何在点击菜单栏的同时，正确触发外部点击事件以关闭下拉框，并解决相关问题。 ... [详细]

蜡笔小新 2024-12-22 17:41:37

apiaoapiao_622

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章