热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

java实现itemcf_基于物品的协同过滤算法ItemCF算法实现

#-*-codingutf-8-*-fromoperatorimportitemgetterfromtexttableimportTexttablefromcollectionsi

#-*- coding=utf-8 -*-

from operator importitemgetterfrom texttable importTexttablefrom collections importdefaultdictimportmath#读取文件

defreadFile(fileData):

data=[]

rates=[]

f=open(fileData,"r")

data=f.readlines()

f.close()for line indata:

dataLine=line.split("\t")

rates.append([int(dataLine[0]),int(dataLine[1]),int(dataLine[2])])returnrates#创建字典,生成用户评分的数据结构#输入:数据集合,格式:用户id\t硬盘id\t用户评分#输出:1.用户字典:dic[用户id]=[(电影id,电影评分)...]#2.电影字典:dic[电影id]=[用户id1,用户id2...]

defcreateDict(rates):

user_dict={}

movie_dict={}for i inrates:if i[0] inuser_dict:

user_dict[i[0]].append((i[1],i[2]))else:

user_dict[i[0]]=[(i[1],i[2])]if i[1] inmovie_dict:

movie_dict[i[1]].append(i[0])else:

movie_dict[i[1]]=[i[0]]returnuser_dict,movie_dict#建立物品倒排表,计算物品相似度

defitemCF(user_dict):

N=dict()

C=defaultdict(defaultdict)

W=defaultdict(defaultdict)for key inuser_dict:for i inuser_dict[key]:if i[0] not in N.keys(): #i[0]表示movie_id

N[i[0]]=0

N[i[0]]+=1 #N[i[0]]表示评论过某电影的用户数

for j inuser_dict[key]:if i==j:continue

if j not inC[i[0]].keys():

C[i[0]][j[0]]=0

C[i[0]][j[0]]+=1 #C[i[0]][j[0]]表示电影两两之间的相似度,eg:同时评论过电影1和电影2的用户数

for i,related_item inC.items():for j,cij inrelated_item.items():

W[i][j]=cij/math.sqrt(N[i]*N[j])returnW#结合用户喜好对物品排序

defrecommondation(user_id,user_dict,K):

rank=defaultdict(int)

l=list()

W=itemCF(user_dict)for i,score in user_dict[user_id]: #i为特定用户的电影id,score为其相应评分

for j,wj in sorted(W[i].items(),key=itemgetter(1),reverse=True)[0:K]: #sorted()的返回值为list,list的元素为元组

if j inuser_dict[user_id]:continuerank[j]+=score*wj #先找出用户评论过的电影集合,对每一部电影id,假设其中一部电影id1,找出与该电影最相似的K部电影,计算出在id1下用户对每部电影的兴趣度,接着迭代整个用户评论过的电影集合,求加权和,再排序,可推荐出前n部电影,我这里取10部。

l=sorted(rank.items(),key=itemgetter(1),reverse=True)[0:10]returnl#获取电影列表

defgetMovieList(item):

items={}

f=open(item,"r",encoding = 'ISO-8859-1')

movie_content=f.readlines()

f.close()for movie inmovie_content:

movieLine=movie.split("|")

items[int(movieLine[0])]=movieLine[1:]#print(items)

returnitems#主程序

if __name__=='__main__':

itemTemp=getMovieList("D:/movieRecommend/ml-100k/u.item") #获取电影列表

fileTemp=readFile("D:/movieRecommend/ml-100k/u.data") #读取文件

user_dic,movie_dic=createDict(fileTemp) #创建字典

user_id=66movieTemp=recommondation(user_id,user_dic,80) #对电影排序

rows=[]

table=Texttable() #创建表格并显示

table.set_deco(Texttable.HEADER)

table.set_cols_dtype(['t','f','a'])

table.set_cols_align(["l","l","l"])

rows.append(["user name","recommondation_movie","from userid"])for i inmovieTemp:

rows.append([user_id,itemTemp[i[0]][0],""])

table.add_rows(rows)print("推荐结果如下:")print(table.draw())



推荐阅读
  • 本文详细介绍了Akka中的BackoffSupervisor机制,探讨其在处理持久化失败和Actor重启时的应用。通过具体示例,展示了如何配置和使用BackoffSupervisor以实现更细粒度的异常处理。 ... [详细]
  • 本文介绍了Java并发库中的阻塞队列(BlockingQueue)及其典型应用场景。通过具体实例,展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递,并结合线程池和原子类优化性能。 ... [详细]
  • golang常用库:配置文件解析库/管理工具viper使用
    golang常用库:配置文件解析库管理工具-viper使用-一、viper简介viper配置管理解析库,是由大神SteveFrancia开发,他在google领导着golang的 ... [详细]
  • 优化ListView性能
    本文深入探讨了如何通过多种技术手段优化ListView的性能,包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]
  • 1:有如下一段程序:packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]
  • 1.如何在运行状态查看源代码?查看函数的源代码,我们通常会使用IDE来完成。比如在PyCharm中,你可以Ctrl+鼠标点击进入函数的源代码。那如果没有IDE呢?当我们想使用一个函 ... [详细]
  • 主要用了2个类来实现的,话不多说,直接看运行结果,然后在奉上源代码1.Index.javaimportjava.awt.Color;im ... [详细]
  • 深入解析Spring Cloud Ribbon负载均衡机制
    本文详细介绍了Spring Cloud中的Ribbon组件如何实现服务调用的负载均衡。通过分析其工作原理、源码结构及配置方式,帮助读者理解Ribbon在分布式系统中的重要作用。 ... [详细]
  • 前言--页数多了以后需要指定到某一页(只做了功能,样式没有细调)html ... [详细]
  • [论文笔记] Crowdsourcing Translation: Professional Quality from Non-Professionals (ACL, 2011)
    Time:4hoursTimespan:Apr15–May3,2012OmarZaidan,ChrisCallison-Burch:CrowdsourcingTra ... [详细]
  • 本文将介绍如何编写一些有趣的VBScript脚本,这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例,帮助您了解VBScript的基本语法和功能。 ... [详细]
  • 技术分享:从动态网站提取站点密钥的解决方案
    本文探讨了如何从动态网站中提取站点密钥,特别是针对验证码(reCAPTCHA)的处理方法。通过结合Selenium和requests库,提供了详细的代码示例和优化建议。 ... [详细]
  • 本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤,帮助开发者快速掌握这一实用技巧。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • Android 渐变圆环加载控件实现
    本文介绍了如何在 Android 中创建一个自定义的渐变圆环加载控件,该控件已在多个知名应用中使用。我们将详细探讨其工作原理和实现方法。 ... [详细]
author-avatar
洱冬橙66_156
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有