R开发：协调过滤推荐

作者：mobiledu2502927067 | 来源：互联网 | 2024-10-21 14:55

set.seed(1234)#加载数据包library(“recommenderlab”)#构造数据运用recommenderlab包实现协同过滤推荐，其数据类型采用S4类构造，需

set.seed ( 1234 )

#加载数据包
library ( &＃8220;recommenderlab&＃8221; )

#构造数据运用recommenderlab包实现协同过滤推荐，其数据类型采用S4类构造，需通过as()函数转为raringMatrix类型。
val1<- matrix ( sample ( c ( as.numeric ( 0 : 5 ) ,NA ) ,50 ,replace = TRUE ,prob = c ( rep ( .4 / 6 , 6 ) , .6 ) ) ,ncol = 10 , dimnames = list ( user = paste ( &＃8220;u&＃8221; ,1 : 5 ,sep = &＃8221; ) ,item = paste ( &＃8220;i&＃8221; ,1 : 10 ,sep = &＃8221; ) ) )
val2 <- as ( val1, &＃8220;realRatingMatrix&＃8221; )

《R开发：协调过滤推荐》

数据转换

val3<- normalize ( val2 )
#二元分类转换，normalize()函数进行标准化处理，标准化的目的是为了去除用户评分的偏差
val4 <- binarize ( val3 , minRating = 4 )
val5 <- as ( val4 , &＃8220;matrix&＃8221; )

《R开发：协调过滤推荐》

数据可视化

接下来，我们采用MovieLense数据集，

data ( MovieLense )
key1 <- sample ( MovieLense , 943 , replace = F )

image ( MovieLense )

《R开发：协调过滤推荐》

hist ( getRatings ( normalize ( MovieLense ) ) , breaks = 100 )

《R开发：协调过滤推荐》

hist ( rowCounts ( key1 ) , breaks = 50 )

《R开发：协调过滤推荐》

建立模型

对于realRatingMatrix有六种方法：IBCF(基于物品的推荐)、UBCF（基于用户的推荐）、PCA（主成分分析）、RANDOM（随机推荐）、SVD（矩阵因子化）、POPULAR（基于流行度的推荐）

建立协同过滤推荐算法模型，主要运用recommender(data=ratingMatrix,method,parameter=NULL)函数，getModel()可查看模型参数

key1_recom <- Recommender (key1 , method = &＃8220;IBCF&＃8221; )
key1_popul <- Recommender ( key1, method = &＃8220;POPULAR&＃8221; )

#查看模型方法

names ( getModel ( key1_recom ) )

《R开发：协调过滤推荐》

模型预测

TOP-N预测

对模型预测可运用predict()函数，在此分别以TOP-N预测及评分预测为例，预测第940-943位观影者的评分情况。n表示最终为TOP-N的列表推荐，参数type = &＃8220;ratings&＃8221;表示运用评分预测观影者对电影评分，模型结果均需转为list或矩阵表示

pred <- predict ( key1_popul ,key1 [ 940 : 943,] , n = 5 )
as ( pred , &＃8220;list&＃8221; )

《R开发：协调过滤推荐》

#top-N为有序列表，抽取最优推荐子集

pred3 <- bestN ( pred , n = 3 )
as ( pred3 , &＃8220;list&＃8221; )

《R开发：协调过滤推荐》

#评分预测

rate <- predict ( key1_popul , key1 [ 940 : 943 ] , type = &＃8220;ratings&＃8221; )
as ( rate , &＃8220;matrix&＃8221; ) [ , 1 : 5 ]

《R开发：协调过滤推荐》

预测模型评价

评分预测模型评价

eva <- evaluationScheme (key1 [ 1 : 800 ] , method = &＃8220;split&＃8221; , train = 0.9,given = 15)

method=&＃8221;split&＃8221;&train=0.9为按90%划分训练测试集合,given为评价的类目数

r_eva1<- Recommender ( getData ( eva , &＃8220;train&＃8221; ) , &＃8220;UBCF&＃8221; )
p_eva1<- predict ( r_eva1 , getData ( eva, &＃8220;known&＃8221; ) , type = &＃8220;ratings&＃8221; )
r_eva2 <- Recommender ( getData ( eva, &＃8220;train&＃8221; ) , &＃8220;IBCF&＃8221; )
p_eva2 <- predict ( r_eva2 , getData ( eva, &＃8220;known&＃8221; ) , type = &＃8220;ratings&＃8221; )

c_eva1 <- calcPredictionAccuracy ( p_eva1 , getData ( eva , &＃8220;unknown&＃8221; ) )
c_eva2 <- calcPredictionAccuracy ( p_eva2 , getData ( eva , &＃8220;unknown&＃8221; ) )
error <- rbind ( c_eva1 , c_eva2 )
rownames ( error ) <- c ( &＃8220;UBCF&＃8221; , &＃8220;IBCF&＃8221; )

计算预测模型的准确度

《R开发：协调过滤推荐》

TOP-N预测模型评价

通过4-fold交叉验证方法分割数据集，运用evaluate()进行TOP-N预测模型评价,评价结果可通过ROC曲线及准确率-召回率曲线展示:

#4-fold交叉验证

tops <- evaluationScheme ( key1 [ 1 : 800 ] , method = &＃8220;cross&＃8221; , k = 4 , given = 3 ,goodRating = 5 )

results <- evaluate ( tops , method = &＃8220;POPULAR&＃8221; , type = &＃8220;topNList&＃8221; ,n = c ( 1 , 3 , 5 , 10 ) )

#获得混淆矩阵

getConfusionMatrix ( results ) [ [ 1 ] ]

avg ( results )

《R开发：协调过滤推荐》

推荐算法的比较

除了对预测模型进行评价，还可以对不同推荐算法进行比较。可首先构建一个推荐算法列表，通过ROC曲线、、准确率-召回率曲线或RMSE直方图进行比较

TOP-N算法比较

set.seed ( 2016 )
scheme <- evaluationScheme ( key1 , method = &＃8220;split&＃8221; , train = 0.9 , k = 1 , given = 10 , goodRating = 5 )
#构建不同算法模型
results <- evaluate ( scheme ,test_data ,n = c ( 1 ,3 ,5 ,10 ,15 ,20 ) )
#模型比较#ROC曲线
plot ( results , annotate = c ( 1 , 3 ) , legend = &＃8220;bottomright&＃8221; )
#准确率-召回率曲线
plot ( results , &＃8220;prec/rec&＃8221; , annotate = c ( 2 , 3 , 4 ) , legend = &＃8220;topleft&＃8221; )
预测评分算法比较
results2 <- evaluate ( scheme , algorithms , type = &＃8220;ratings&＃8221; )
plot ( results2 , ylim = c ( 0 , 20 ) )

推荐阅读

heap
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
string
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
string
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
const
Unity 客户端框架设计：UI管理系统的构建

本文详细介绍了如何构建一个高效的UI管理系统，集中处理UI页面的打开、关闭、层级管理和页面跳转等问题。通过UIManager统一管理外部切换逻辑，实现功能逻辑分散化和代码复用，支持多人协作开发。 ... [详细]

蜡笔小新 2024-12-27 10:28:40
string
深入理解Python的os和sys模块

本文详细解析了Python中的os和sys模块，介绍了它们的功能、常用方法及其在实际编程中的应用。 ... [详细]

蜡笔小新 2024-12-26 22:04:19
rsa
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
rsa
Transforming the Future of Virtual Worlds

Explore how Matterverse is redefining the metaverse experience, creating immersive and meaningful virtual environments that foster genuine connections and economic opportunities. ... [详细]

蜡笔小新 2024-12-28 09:44:49
string
Handling Null Object Encoding in OAuth 1.0a API Implementation

Explore a common issue encountered when implementing an OAuth 1.0a API, specifically the inability to encode null objects and how to resolve it. ... [详细]

蜡笔小新 2024-12-28 08:54:34
request
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
int
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
string
深入解析ExpandableComposite.addExpansionListener()方法及其应用

本文详细介绍了Java中org.eclipse.ui.forms.widgets.ExpandableComposite类的addExpansionListener()方法，并提供了多个实际代码示例，帮助开发者更好地理解和使用该方法。这些示例来源于多个知名开源项目，具有很高的参考价值。 ... [详细]

蜡笔小新 2024-12-27 16:11:49
const
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
const
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
const
Java 序列化接口详解

本文深入探讨了 Java 中的 Serializable 接口，解释了其实现机制、用途及注意事项，帮助开发者更好地理解和使用序列化功能。 ... [详细]

蜡笔小新 2024-12-27 15:06:12
string
2023年京东Android面试真题解析与经验分享

本文由一位拥有6年Android开发经验的工程师撰写，详细解析了京东面试中常见的技术问题。涵盖引用传递、Handler机制、ListView优化、多线程控制及ANR处理等核心知识点。 ... [详细]

蜡笔小新 2024-12-26 17:45:48

mobiledu2502927067

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章