推荐方法总结

作者：帅哥刘常胜 | 来源：互联网 | 2023-07-04 16:13

在推荐系统简介中，我们给出了推荐系统的一般框架。很明显，推荐方法是整个推荐系统中最核心、最关键的部分，很大程度上决定了推荐系统性能的优劣。

在推荐系统简介中&＃xff0c;我们给出了推荐系统的一般框架。很明显&＃xff0c;推荐方法是整个推荐系统中最核心、最关键的部分&＃xff0c;很大程度上决定了推荐系统性能的优劣。目前&＃xff0c;主要的推荐方法包括&＃xff1a;基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和组合推荐。

一、基于内容推荐

基于内容的推荐&＃xff08;Content-based Recommendation&＃xff09;是信息过滤技术的延续与发展&＃xff0c;它是建立在项目的内容信息上作出推荐的&＃xff0c;而不需要依据用户对项目的评价意见&＃xff0c;更多地需要用机器学习的方法从关于内容的特征描述的事例中得到用户的兴趣资料。在基于内容的推荐系统中&＃xff0c;项目或对象是通过相关的特征的属性来定义&＃xff0c;系统基于用户评价对象的特征&＃xff0c;学习用户的兴趣&＃xff0c;考察用户资料与待预测项目的相匹配程度。用户的资料模型取决于所用学习方法&＃xff0c;常用的有决策树、神经网络和基于向量的表示方法等。基于内容的用户资料是需要有用户的历史数据&＃xff0c;用户资料模型可能随着用户的偏好改变而发生变化。

基于内容推荐方法的优点是&＃xff1a;

1&＃xff09;不需要其它用户的数据&＃xff0c;没有冷开始问题和稀疏问题。

2&＃xff09;能为具有特殊兴趣爱好的用户进行推荐。
3&＃xff09;能推荐新的或不是很流行的项目&＃xff0c;没有新项目问题。
4&＃xff09;通过列出推荐项目的内容特征&＃xff0c;可以解释为什么推荐那些项目。
5&＃xff09;已有比较好的技术&＃xff0c;如关于分类学习方面的技术已相当成熟。

缺点是要求内容能容易抽取成有意义的特征&＃xff0c;要求特征内容有良好的结构性&＃xff0c;并且用户的口味必须能够用内容特征形式来表达&＃xff0c;不能显式地得到其它用户的判断情况。

二、协同过滤推荐

协同过滤推荐&＃xff08;Collaborative Filtering Recommendation&＃xff09;技术是推荐系统中应用最早和最为成功的技术之一。它一般采用最近邻技术&＃xff0c;利用用户的历史喜好信息计算用户之间的距离&＃xff0c;然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度&＃xff0c;系统从而根据这一喜好程度来对目标用户进行推荐。协同过滤最大优点是对推荐对象没有特殊的要求&＃xff0c;能处理非结构化的复杂对象&＃xff0c;如音乐、电影。

协同过滤是基于这样的假设&＃xff1a;为一用户找到他真正感兴趣的内容的好方法是首先找到与此用户有相似兴趣的其他用户&＃xff0c;然后将他们感兴趣的内容推荐给此用户。其基本思想非常易于理解&＃xff0c;在日常生活中&＃xff0c;我们往往会利用好朋友的推荐来进行一些选择。协同过滤正是把这一思想运用到电子商务推荐系统中来&＃xff0c;基于其他用户对某一内容的评价来向目标用户进行推荐。

基于协同过滤的推荐系统可以说是从用户的角度来进行相应推荐的&＃xff0c;而且是自动的&＃xff0c;即用户获得的推荐是系统从购买模式或浏览行为等隐式获得的&＃xff0c;不需要用户努力地找到适合自己兴趣的推荐信息&＃xff0c;如填写一些调查表格等。

和基于内容的过滤方法相比&＃xff0c;协同过滤具有如下的优点&＃xff1a;

1&＃xff09; 能够过滤难以进行机器自动内容分析的信息&＃xff0c;如艺术品&＃xff0c;音乐等。
2&＃xff09; 共享其他人的经验&＃xff0c;避免了内容分析的不完全和不精确&＃xff0c;并且能够基于一些复杂的&＃xff0c;难以表述的概念&＃xff08;如信息质量、个人品味&＃xff09;进行过滤。
3&＃xff09; 有推荐新信息的能力。可以发现内容上完全不相似的信息&＃xff0c;用户对推荐信息的内容事先是预料不到的。这也是协同过滤和基于内容的过滤一个较大的差别&＃xff0c;基于内容的过滤推荐很多都是用户本来就熟悉的内容&＃xff0c;而协同过滤可以发现用户潜在的但自己尚未发现的兴趣偏好。
4&＃xff09; 能够有效的使用其他相似用户的反馈信息&＃xff0c;较少用户的反馈量&＃xff0c;加快个性化学习的速度。

虽然协同过滤作为一种典型的推荐技术有其相当的应用&＃xff0c;但协同过滤仍有许多的问题需要解决。最典型的问题有稀疏问题&＃xff08;Sparsity&＃xff09;和可扩展问题&＃xff08;Scalability&＃xff09;。

三、基于关联规则推荐

基于关联规则的推荐&＃xff08;Association Rule-based Recommendation&＃xff09;是以关联规则为基础&＃xff0c;把已购商品作为规则头&＃xff0c;规则体为推荐对象。关联规则挖掘可以发现不同商品在销售过程中的相关性&＃xff0c;在零售业中已经得到了成功的应用。管理规则就是在一个交易数据库中统计购买了商品集X的交易中有多大比例的交易同时购买了商品集Y&＃xff0c;其直观的意义就是用户在购买某些商品的时候有多大倾向去购买另外一些商品。比如购买牛奶的同时很多人会同时购买面包。

算法的第一步关联规则的发现最为关键且最耗时&＃xff0c;是算法的瓶颈&＃xff0c;但可以离线进行。其次&＃xff0c;商品名称的同义性问题也是关联规则的一个难点。

四、基于效用推荐

基于效用的推荐&＃xff08;Utility-based Recommendation&＃xff09;是建立在对用户使用项目的效用情况上计算的&＃xff0c;其核心问题是怎么样为每一个用户去创建一个效用函数&＃xff0c;因此&＃xff0c;用户资料模型很大程度上是由系统所采用的效用函数决定的。基于效用推荐的好处是它能把非产品的属性&＃xff0c;如提供商的可靠性&＃xff08;Vendor Reliability&＃xff09;和产品的可得性&＃xff08;Product Availability&＃xff09;等考虑到效用计算中。

五、基于知识推荐

基于知识的推荐&＃xff08;Knowledge-based Recommendation&＃xff09;在某种程度是可以看成是一种推理&＃xff08;Inference&＃xff09;技术&＃xff0c;它不是建立在用户需要和偏好基础上推荐的。基于知识的方法因它们所用的功能知识不同而有明显区别。效用知识&＃xff08;Functional Knowledge&＃xff09;是一种关于一个项目如何满足某一特定用户的知识&＃xff0c;因此能解释需要和推荐的关系&＃xff0c;所以用户资料可以是任何能支持推理的知识结构&＃xff0c;它可以是用户已经规范化的查询&＃xff0c;也可以是一个更详细的用户需要的表示。

六、组合推荐

由于各种推荐方法都有优缺点&＃xff0c;所以在实际中&＃xff0c;组合推荐&＃xff08;Hybrid Recommendation&＃xff09;经常被采用。研究和应用最多的是内容推荐和协同过滤推荐的组合。最简单的做法就是分别用基于内容的方法和协同过滤推荐方法去产生一个推荐预测结果&＃xff0c;然后用某方法组合其结果。尽管从理论上有很多种推荐组合方法&＃xff0c;但在某一具体问题中并不见得都有效&＃xff0c;组合推荐一个最重要原则就是通过组合后要能避免或弥补各自推荐技术的弱点。

在组合方式上&＃xff0c;有研究人员提出了七种组合思路&＃xff1a;
1&＃xff09;加权&＃xff08;Weight&＃xff09;&＃xff1a;加权多种推荐技术结果。
2&＃xff09;变换&＃xff08;Switch&＃xff09;&＃xff1a;根据问题背景和实际情况或要求决定变换采用不同的推荐技术。
3&＃xff09;混合&＃xff08;Mixed&＃xff09;&＃xff1a;同时采用多种推荐技术给出多种推荐结果为用户提供参考。
4&＃xff09;特征组合&＃xff08;Feature combination&＃xff09;&＃xff1a;组合来自不同推荐数据源的特征被另一种推荐算法所采用。
5&＃xff09;层叠&＃xff08;Cascade&＃xff09;&＃xff1a;先用一种推荐技术产生一种粗糙的推荐结果&＃xff0c;第二种推荐技术在此推荐结果的基础上进一步作出更精确的推荐。
6&＃xff09;特征扩充&＃xff08;Feature augmentation&＃xff09;&＃xff1a;一种技术产生附加的特征信息嵌入到另一种推荐技术的特征输入中。
7&＃xff09;元级别&＃xff08;Meta-level&＃xff09;&＃xff1a;用一种推荐方法产生的模型作为另一种推荐方法的输入。

主要推荐方法的对比

各种推荐方法都有其各自的优点和缺点&＃xff0c;见表1。

表1 主要推荐方法对比

推荐方法

优点

缺点

基于内容推荐

推荐结果直观&＃xff0c;容易解释&＃xff1b;

不需要领域知识

稀疏问题&＃xff1b;新用户问题&＃xff1b;

复杂属性不好处理&＃xff1b;

要有足够数据构造分类器

协同过滤推荐

新异兴趣发现、不需要领域知识&＃xff1b;

随着时间推移性能提高&＃xff1b;

推荐个性化、自动化程度高&＃xff1b;

能处理复杂的非结构化对象

稀疏问题&＃xff1b;

可扩展性问题&＃xff1b;

新用户问题&＃xff1b;

质量取决于历史数据集&＃xff1b;

系统开始时推荐质量差&＃xff1b;

基于规则推荐

能发现新兴趣点&＃xff1b;

不要领域知识

规则抽取难、耗时&＃xff1b;

产品名同义性问题&＃xff1b;

个性化程度低&＃xff1b;

基于效用推荐

无冷开始和稀疏问题&＃xff1b;

对用户偏好变化敏感&＃xff1b;

能考虑非产品特性

用户必须输入效用函数&＃xff1b;

推荐是静态的&＃xff0c;灵活性差&＃xff1b;

属性重叠问题&＃xff1b;

基于知识推荐

能把用户需求映射到产品上&＃xff1b;

能考虑非产品属性

知识难获得&＃xff1b;

推荐是静态的

转自&＃xff1a;http://blog.sina.com.cn/s/blog_73de143c010153vp.html

转载于:https://www.cnblogs.com/ywl925/p/3545439.html

推荐阅读

function
【shell】网络处理：判断IP是否在网段、两个ip是否同网段、IP地址范围、网段包含关系

本文介绍了使用shell脚本判断IP是否在同一网段、判断IP地址是否在某个范围内、计算IP地址范围、判断网段之间的包含关系的方法和原理。通过对IP和掩码进行与计算，可以判断两个IP是否在同一网段。同时，还提供了一段用于验证IP地址的正则表达式和判断特殊IP地址的方法。 ... [详细]

蜡笔小新 2023-12-12 11:19:14
int
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
heap
阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾

本文介绍了阿里Treebased Deep Match(TDM)的学习笔记，同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法，再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用，并介绍了TDM的背景和优势。最后，文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]

蜡笔小新 2023-12-14 19:24:58
int
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
select
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
php
知识图谱——机器大脑中的知识库

本文介绍了知识图谱在机器大脑中的应用，以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例，说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案，如搜索关键词"Marie Curie"，会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革，不仅美国的微软必应，中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]

蜡笔小新 2023-12-14 10:06:19
int
Spark实现高斯朴素贝叶斯模型的低配版

本文介绍了使用Spark实现低配版高斯朴素贝叶斯模型的原因和原理。随着数据量的增大，单机上运行高斯朴素贝叶斯模型会变得很慢，因此考虑使用Spark来加速运行。然而，Spark的MLlib并没有实现高斯朴素贝叶斯模型，因此需要自己动手实现。文章还介绍了朴素贝叶斯的原理和公式，并对具有多个特征和类别的模型进行了讨论。最后，作者总结了实现低配版高斯朴素贝叶斯模型的步骤。 ... [详细]

蜡笔小新 2023-12-10 21:42:37
int
拆点+KM，建图思路看的题解，求解最小权匹配问题

本文介绍了一种求解最小权匹配问题的方法，使用了拆点和KM算法。通过将机器拆成多个点，表示加工的顺序，然后使用KM算法求解最小权匹配，得到最优解。文章给出了具体的代码实现，并提供了一篇题解作为参考。 ... [详细]

蜡笔小新 2023-12-09 09:24:15
io
AstridDAO 专访：波卡稳定币黑马 BAI

加入Pol ... [详细]

蜡笔小新 2023-10-17 18:14:14
php
GetWindowLong函数

今天在看一个代码里头写了GetWindowLong(hwnd,0)，我当时就有点费解，靠，上网搜索函数原型说明，死活找不到第 ... [详细]

蜡笔小新 2023-12-14 17:58:15
heap
EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析

本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程，并分析了其所需的资源容量。通过解决错误提示和调整内存大小，成功存储了波形数据。然后，讨论了储存环逐束团信号的意义，以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大，每天需要近250G，一年需要90T。然而，储存环逐束团信号具有重要意义，可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]

蜡笔小新 2023-12-14 17:43:56
io
【译】发送表单数据

这是原文链接：sendingformdata许多情况下，我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单，但是 ... [详细]

蜡笔小新 2023-12-14 16:19:10
io
如何去除Win7快捷方式的箭头

本文介绍了如何去除Win7快捷方式的箭头的方法，通过生成一个透明的ico图标并将其命名为Empty.ico，将图标复制到windows目录下，并导入注册表，即可去除箭头。这样做可以改善默认快捷方式的外观，提升桌面整洁度。 ... [详细]

蜡笔小新 2023-12-14 16:17:05
java
Java集合库的使用方法及下溯造型的应用

本文介绍了Java集合库的使用方法，包括如何方便地重复使用集合以及下溯造型的应用。通过使用集合库，可以方便地取用各种集合，并将其插入到自己的程序中。为了使集合能够重复使用，Java提供了一种通用类型，即Object类型。通过添加指向集合的对象句柄，可以实现对集合的重复使用。然而，由于集合只能容纳Object类型，当向集合中添加对象句柄时，会丢失其身份或标识信息。为了恢复其本来面貌，可以使用下溯造型。本文还介绍了Java 1.2集合库的特点和优势。 ... [详细]

蜡笔小新 2023-12-10 17:57:40
java
《树莓派开发实战（第2版）》——2.2　创建模型和运行推理：重回Hello World

本节书摘来异步社区《概率编程实战》一书中的第2章，第2.2节，作者：【美】AviPfeffer（艾维费弗）&# ... [详细]

蜡笔小新 2023-10-17 19:56:35

帅哥刘常胜

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章