当前位置: 开发笔记 > 编程语言 > 正文

java实现itemcf_基于物品的协同过滤算法ItemCF算法实现

作者：洱冬橙66_156 | 来源：互联网 | 2023-09-25 14:14

#-*-codingutf-8-*-fromoperatorimportitemgetterfromtexttableimportTexttablefromcollectionsi

#-*- coding&＃61;utf-8 -*-

from operator importitemgetterfrom texttable importTexttablefrom collections importdefaultdictimportmath#读取文件

defreadFile(fileData):

data&＃61;[]

rates&＃61;[]

f&＃61;open(fileData,"r")

data&＃61;f.readlines()

f.close()for line indata:

dataLine&＃61;line.split("\t")

rates.append([int(dataLine[0]),int(dataLine[1]),int(dataLine[2])])returnrates#创建字典&＃xff0c;生成用户评分的数据结构#输入&＃xff1a;数据集合&＃xff0c;格式&＃xff1a;用户id\t硬盘id\t用户评分#输出:1.用户字典&＃xff1a;dic[用户id]&＃61;[(电影id,电影评分)...]#2.电影字典&＃xff1a;dic[电影id]&＃61;[用户id1,用户id2...]

defcreateDict(rates):

user_dict&＃61;{}

movie_dict&＃61;{}for i inrates:if i[0] inuser_dict:

user_dict[i[0]].append((i[1],i[2]))else:

user_dict[i[0]]&＃61;[(i[1],i[2])]if i[1] inmovie_dict:

movie_dict[i[1]].append(i[0])else:

movie_dict[i[1]]&＃61;[i[0]]returnuser_dict,movie_dict#建立物品倒排表,计算物品相似度

defitemCF(user_dict):

N&＃61;dict()

C&＃61;defaultdict(defaultdict)

W&＃61;defaultdict(defaultdict)for key inuser_dict:for i inuser_dict[key]:if i[0] not in N.keys(): #i[0]表示movie_id

N[i[0]]&＃61;0

N[i[0]]&＃43;&＃61;1 #N[i[0]]表示评论过某电影的用户数

for j inuser_dict[key]:if i&＃61;&＃61;j:continue

if j not inC[i[0]].keys():

C[i[0]][j[0]]&＃61;0

C[i[0]][j[0]]&＃43;&＃61;1 #C[i[0]][j[0]]表示电影两两之间的相似度&＃xff0c;eg&＃xff1a;同时评论过电影1和电影2的用户数

for i,related_item inC.items():for j,cij inrelated_item.items():

W[i][j]&＃61;cij/math.sqrt(N[i]*N[j])returnW#结合用户喜好对物品排序

defrecommondation(user_id,user_dict,K):

rank&＃61;defaultdict(int)

l&＃61;list()

W&＃61;itemCF(user_dict)for i,score in user_dict[user_id]: #i为特定用户的电影id&＃xff0c;score为其相应评分

for j,wj in sorted(W[i].items(),key&＃61;itemgetter(1),reverse&＃61;True)[0:K]: #sorted()的返回值为list,list的元素为元组

if j inuser_dict[user_id]:continuerank[j]&＃43;&＃61;score*wj #先找出用户评论过的电影集合&＃xff0c;对每一部电影id&＃xff0c;假设其中一部电影id1,找出与该电影最相似的K部电影&＃xff0c;计算出在id1下用户对每部电影的兴趣度&＃xff0c;接着迭代整个用户评论过的电影集合&＃xff0c;求加权和&＃xff0c;再排序&＃xff0c;可推荐出前n部电影&＃xff0c;我这里取10部。

l&＃61;sorted(rank.items(),key&＃61;itemgetter(1),reverse&＃61;True)[0:10]returnl#获取电影列表

defgetMovieList(item):

items&＃61;{}

f&＃61;open(item,"r",encoding &＃61; &＃39;ISO-8859-1&＃39;)

movie_content&＃61;f.readlines()

f.close()for movie inmovie_content:

movieLine&＃61;movie.split("|")

items[int(movieLine[0])]&＃61;movieLine[1:]#print(items)

returnitems#主程序

if __name__&＃61;&＃61;&＃39;__main__&＃39;:

itemTemp&＃61;getMovieList("D:/movieRecommend/ml-100k/u.item") #获取电影列表

fileTemp&＃61;readFile("D:/movieRecommend/ml-100k/u.data") #读取文件

user_dic,movie_dic&＃61;createDict(fileTemp) #创建字典

user_id&＃61;66movieTemp&＃61;recommondation(user_id,user_dic,80) #对电影排序

rows&＃61;[]

table&＃61;Texttable() #创建表格并显示

table.set_deco(Texttable.HEADER)

table.set_cols_dtype([&＃39;t&＃39;,&＃39;f&＃39;,&＃39;a&＃39;])

table.set_cols_align(["l","l","l"])

rows.append(["user name","recommondation_movie","from userid"])for i inmovieTemp:

rows.append([user_id,itemTemp[i[0]][0],""])

table.add_rows(rows)print("推荐结果如下&＃xff1a;")print(table.draw())

推荐阅读

int
Akka BackoffSupervisor的深入解析与实践

本文详细介绍了Akka中的BackoffSupervisor机制，探讨其在处理持久化失败和Actor重启时的应用。通过具体示例，展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]

蜡笔小新 2024-12-27 15:04:09
int
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
int
golang常用库：配置文件解析库/管理工具viper使用

golang常用库：配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库，是由大神SteveFrancia开发，他在google领导着golang的 ... [详细]

蜡笔小新 2024-12-28 13:47:52
int
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
int
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
int
Python 的 10 个开发技巧！太实用了

1.如何在运行状态查看源代码？查看函数的源代码，我们通常会使用IDE来完成。比如在PyCharm中，你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢？当我们想使用一个函 ... [详细]

蜡笔小新 2024-12-27 18:36:54
int
java编写的简易计算器

主要用了2个类来实现的，话不多说，直接看运行结果，然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]

蜡笔小新 2024-12-27 18:18:10
int
深入解析Spring Cloud Ribbon负载均衡机制

本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式，帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]

蜡笔小新 2024-12-27 16:01:25
int
分页插件3指定到某一页

前言--页数多了以后需要指定到某一页（只做了功能，样式没有细调）html ... [详细]

蜡笔小新 2024-12-27 15:19:01
java
[论文笔记] Crowdsourcing Translation: Professional Quality from Non-Professionals (ACL, 2011)

Time:4hoursTimespan:Apr15–May3,2012OmarZaidan,ChrisCallison-Burch:CrowdsourcingTra ... [详细]

蜡笔小新 2024-12-28 13:39:05
int
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
int
技术分享：从动态网站提取站点密钥的解决方案

本文探讨了如何从动态网站中提取站点密钥，特别是针对验证码（reCAPTCHA）的处理方法。通过结合Selenium和requests库，提供了详细的代码示例和优化建议。 ... [详细]

蜡笔小新 2024-12-28 04:11:47
require
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
int
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
int
Android 渐变圆环加载控件实现

本文介绍了如何在 Android 中创建一个自定义的渐变圆环加载控件，该控件已在多个知名应用中使用。我们将详细探讨其工作原理和实现方法。 ... [详细]

蜡笔小新 2024-12-27 13:34:19

洱冬橙66_156

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章