热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

推荐系统_历史最全16个推荐系统开放公共数据集整理分享

篇首语:本文由编程笔记#小编为大家整理,主要介绍了历史最全-16个推荐系统开放公共数据集整理分享相关的知识,希望对你有一定的参考价值。

篇首语:本文由编程笔记#小编为大家整理,主要介绍了历史最全-16个推荐系统开放公共数据集整理分享相关的知识,希望对你有一定的参考价值。


























    (本文由深度学习与NLP编译)


    本文主要整理了一些与推荐系统相关的高质量的数据集。整理自Stack Overflow、一些文章、推荐站点和学术实验。其中,大多数数据集都是免费、开放的,但有些不是,需要获得许可或引用作者的工作才能使用。此外,其中也包含一些预处理数据,可用于学术实验。链接和数据集描述。




Book


· 1. Book Crossing














    BookCrossing(BX)数据集由Cai-Nicolas花了的4周(2004年8月/ 9月)从Book-Crossing社区中爬取得到的。


· 下载链接:http://www2.informatik.uni-freiburg.de/~cziegler/BX/




电子商务


· 2. Amazon








历史最全-16个推荐系统开放公共数据集整理分享






    该数据集包括自1996年5月至2014年7月,来自亚马逊上的1.428亿产品的评论和metadata。


· 下载链接:http://jmcauley.ucsd.edu/data/amazon/




· 3. Retailrocket推荐系统数据集








历史最全-16个推荐系统开放公共数据集整理分享






    该数据集由三个文件组成:一个行为数据集(events.csv),一个属性数据集(item_properties.сsv)和一个类目树数据集(category_tree.сsv)。该数据来自现实世界的电子商务网站。


· 下载链接:https://www.kaggle.com/retailrocket/ecommerce-dataset




音乐


· 4. Amazon Music








历史最全-16个推荐系统开放公共数据集整理分享






    该数字音乐数据集包含来自亚马逊的评论和元数据


· 下载链接:http://jmcauley.ucsd.edu/data/amazon/




· 5. Yahoo Music








历史最全-16个推荐系统开放公共数据集整理分享






    该数据集是一个快照,收集了音乐社区对各种音乐艺术家的偏好。


· 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r




· 6. LastFM(Implicit)








历史最全-16个推荐系统开放公共数据集整理分享






    该数据集收集了Last.fm网站上2千名用户的社交网络、tagging和music artist listening信息。


· 下载链接:https://grouplens.org/datasets/hetrec-2011/




· 7. Milion Song Dataset








历史最全-16个推荐系统开放公共数据集整理分享






    Million Song数据集是一个免费的数据集,提供了一百万条当代流行音乐曲目相关的的audio features和metadata。


· 下载链接:https://labrosa.ee.columbia.edu/millionsong/




电影


· 8. MovieLens








历史最全-16个推荐系统开放公共数据集整理分享






    GroupLens Research已经从他们的电影网站收集整理的rating数据集。


· 下载链接:https://grouplens.org/datasets/movielens/




· 9. Yahoo Movies








历史最全-16个推荐系统开放公共数据集整理分享






    该数据集包含从两个不同来源收集的歌曲的rating数据集。第一个来源是用户在与Yahoo上使用音乐服务是产生的rating数据。


· 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r




· 10. CiaoDVD








历史最全-16个推荐系统开放公共数据集整理分享






    CiaoDVD是2013年12月从dvd.ciao.co.uk网站上抓取的DVD类别数据集。


· 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r




·11. FilmTrust








历史最全-16个推荐系统开放公共数据集整理分享






    FilmTrust是2011年6月从整个FilmTrust网站上抓取的一个小型数据集。


· 下载链接:https://www.librec.net/datasets.html




· 12. Netflix








历史最全-16个推荐系统开放公共数据集整理分享






    这是Netflix奖竞赛中使用的官方数据集。


· 下载链接:http://academictorrents.com/details/9b13183dc4d60676b773c9e2cd6de5e5542cee9a




游戏


· 13. Steam Video Games








历史最全-16个推荐系统开放公共数据集整理分享






    这是一个用户行数据集,包含:user-id,game-title,behavior-name,value。包括“purchase”和“play”数据集。购买了,puchase的值为1,而“play”的值表示用户播放音乐的时长。


· 下载链接:https://www.kaggle.com/tamber/steam-video-games/data




Jokes


· 14. Jester








历史最全-16个推荐系统开放公共数据集整理分享






    该笑话数据集包含来自73,496个用户,关于100个笑话的410万连续rating数据(-10.00到+10.00)


· 下载链接:http://www.ieor.berkeley.edu/~goldberg/jester-data/




餐饮


·15. Chicago Entree








历史最全-16个推荐系统开放公共数据集整理分享






    该数据集包含用户与Entree Chicago餐厅推荐系统交互的记录数据。


· 下载链接:http://archive.ics.uci.edu/ml/datasets/Entree+Chicago+Recommendation+Data




动漫


·16. 动漫推荐数据库








历史最全-16个推荐系统开放公共数据集整理分享






    该数据集包含来自12,294个动漫的73,516个用户的用户偏好数据。每个用户都可以将动画添加到已完成的列表中并为其评分,该数据集把这些评级整理起来。


· 下载链接:https://www.kaggle.com/CooperUnion/anime-recommendations-database




其他数据集


· GroupLens数据集








历史最全-16个推荐系统开放公共数据集整理分享






· 下载链接:https://grouplens.org/datasets/




· LibRec数据集








历史最全-16个推荐系统开放公共数据集整理分享






· 下载链接:https://www.librec.net/datasets.html




· Yahoo Research数据集








历史最全-16个推荐系统开放公共数据集整理分享






· 下载链接:https://webscope.sandbox.yahoo.com/catalog.php?datatype=r




· 斯坦福大型网络数据集汇编








历史最全-16个推荐系统开放公共数据集整理分享






· 下载链接:https://snap.stanford.edu/data/


















往期精彩内容推荐



































历史最全-16个推荐系统开放公共数据集整理分享




扫描下方二维码可以订阅哦!


















历史最全-16个推荐系统开放公共数据集整理分享









历史最全-16个推荐系统开放公共数据集整理分享


DeepLearning_NLP




历史最全-16个推荐系统开放公共数据集整理分享












深度学习与NLP






























推荐阅读
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • 向QTextEdit拖放文件的方法及实现步骤
    本文介绍了在使用QTextEdit时如何实现拖放文件的功能,包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数,并结合QMimeData和QUrl等类,可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]
  • 原文地址:https:www.cnblogs.combaoyipSpringBoot_YML.html1.在springboot中,有两种配置文件,一种 ... [详细]
  • baresip android编译、运行教程1语音通话
    本文介绍了如何在安卓平台上编译和运行baresip android,包括下载相关的sdk和ndk,修改ndk路径和输出目录,以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • EzPP 0.2发布,新增YAML布局渲染功能
    EzPP发布了0.2.1版本,新增了YAML布局渲染功能,可以将YAML文件渲染为图片,并且可以复用YAML作为模版,通过传递不同参数生成不同的图片。这个功能可以用于绘制Logo、封面或其他图片,让用户不需要安装或卸载Photoshop。文章还提供了一个入门例子,介绍了使用ezpp的基本渲染方法,以及如何使用canvas、text类元素、自定义字体等。 ... [详细]
  • 在IDEA中运行CAS服务器的配置方法
    本文介绍了在IDEA中运行CAS服务器的配置方法,包括下载CAS模板Overlay Template、解压并添加项目、配置tomcat、运行CAS服务器等步骤。通过本文的指导,读者可以轻松在IDEA中进行CAS服务器的运行和配置。 ... [详细]
  • 1Lock与ReadWriteLock1.1LockpublicinterfaceLock{voidlock();voidlockInterruptibl ... [详细]
  • 判断编码是否可立即解码的程序及电话号码一致性判断程序
    本文介绍了两个编程题目,一个是判断编码是否可立即解码的程序,另一个是判断电话号码一致性的程序。对于第一个题目,给出一组二进制编码,判断是否存在一个编码是另一个编码的前缀,如果不存在则称为可立即解码的编码。对于第二个题目,给出一些电话号码,判断是否存在一个号码是另一个号码的前缀,如果不存在则说明这些号码是一致的。两个题目的解法类似,都使用了树的数据结构来实现。 ... [详细]
  • Spring源码解密之默认标签的解析方式分析
    本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断,区分默认命名空间和自定义命名空间,并采用不同的解析方式。其中,bean标签的解析最为复杂和重要。 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • 求解连通树的最小长度及优化
    本文介绍了求解连通树的最小长度的方法,并通过四边形不等式进行了优化。具体方法为使用状态转移方程求解树的最小长度,并通过四边形不等式进行优化。 ... [详细]
author-avatar
sunshinechenxm
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有