当前位置: 开发笔记 > 编程语言 > 正文

推荐系统_干货！600页《推荐系统学习手册》（附下载链接及入门经验）

作者： | 来源：互联网 | 2023-08-06 15:20

篇首语：本文由编程笔记#小编为大家整理，主要介绍了干货！600页《推荐系统学习手册》（附下载链接及入门经验）相关的知识，希望对你有一定的参考价值。这是之前学习推荐系统时的

篇首语：本文由编程笔记#小编为大家整理，主要介绍了干货！600页《推荐系统学习手册》（附下载链接及入门经验）相关的知识，希望对你有一定的参考价值。

这是之前学习推荐系统时的学习资料，非常全面，包含经典模型的解析及代码实现、模型的评估、最新工业界论文解读等等，全网仅此一份！该手册有PDF版本和Markdown版本，总计有600多页！

资料领取方式：

1.扫码关注下方 “小小挖掘机” 公众号

2.回复关键词：手册

小小挖掘机

经典模型解析及代码实现：

干货！600页《推荐系统学习手册》（附下载链接及入门经验）

模型评价：

干货！600页《推荐系统学习手册》（附下载链接及入门经验）

最新工业界论文解读：

干货！600页《推荐系统学习手册》（附下载链接及入门经验）

再讲一下作者的推荐系统入门经验，大致可以分为以下五个阶段：

1、第一阶段 - 掌握机器学习基础知识，打好基础

学习推荐系统，还是要掌握一定的机器学习知识的，从特征获取、特征处理、特征选择，到基本的机器学习模型如逻辑回归、GBDT等等，都需要你熟练掌握。

其中比较重要的就是特征这块，因为推荐系统中会面临大量的离散特征，对离散特征的处理方式需要有一定的了解。

这里还是推荐李航博士的《统计学习方法第二版》。

然后就是神经网络，推荐系统中神经网络运用非常多，神经网络中基础的如循环神经网络、卷积神经网络，以及一些模型结构的搭建、训练的技巧如Dropout、BN等等也需要有所理解。

这个推荐吴恩达的深度学习课程以及李宏毅老师的深度学习课程。

2、第二阶段 - 阅读推荐系统经典书籍，入门推荐

推荐系统市面上的书不是很多，而且写得往往不够深入，仅能够起到一定的入门作用，毕竟推荐在各个公司还是比较核心的内容，是比较受到保护的。但经典的书籍还是有的，入门的话推荐两本。

一是大家所熟知的《推荐系统实践》，这本的话对于大家了解推荐系统中最基本的算法如协同过滤、推荐系统中常用的评价指标、使用上下文和社交网络进行推荐、如何解决冷启动问题都有一定的帮助。

二是最近市面上新出现的《推荐系统开发实战》一书，虽然这本书我还没有看过，但不少的群友反映这本书对于入门推荐系统来说十分友好。理论和实战相结合，是挺不错的一本“小白实操书”。

然后还有的一些书籍如《推荐系统与深度学习》和《推荐系统-技术、评估及高效算法》，大家感兴趣的话也可以进行阅读。

3、第三阶段 - 精度推荐系统经典论文，掌握诀窍

在理解基本的推荐知识之后，你大概会了解到推荐具体是做什么的，那么其问题又可以分成几个方面。如召回、CTR预估、Learning to Rank等等。这个时候我建议的话就是开始阅读经典论文了。下面整理一些我看过的比较经典的论文吧，可能有遗漏，也欢迎大家补充。

FM：《Factorization Machines》
FFM：《Field-aware Factorization Machines for CTR Prediction》
DeepFM：《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》
Wide & Deep：《Wide & Deep Learning for Recommender Systems》
DCN：《Deep & Cross Network for Ad Click Predictions》
NFM：《Neural Factorization Machines for Sparse Predictive Analytics》
AFM：《Attentional Factorization Machines:
Learning the Weight of Feature Interactions via Attention Networks》
GBDT + LR：《Practical Lessons from Predicting Clicks on Ads at Facebook》
MLR：《Learning Piece-wise Linear Models
from Large Scale Data for Ad Click Prediction》
DIN：《Deep Interest Network for Click-Through Rate Prediction》
DIEN：《Deep Interest Evolution Network for Click-Through Rate Prediction》
BPR：《BPR: Bayesian Personalized Ranking from Implicit Feedback》
Youtube：《Deep Neural Networks for YouTube Recommendations》

当然有些其他的论文也十分经典，咱们放在后面继续讲。

读论文也是需要一定的技巧，不同的人可能关注的点不一样，所以导致阅读重心不一样。对于我来说，我比较关注的点是这个论文要解决什么样的问题，是如何解决的，以及作者从哪几方面出发，使用什么评价指标来评判模型的好坏。至于效果，论文嘛，可信可不信，看看就好了。

最近上市的《深度学习推荐系统》也可以帮你快速梳理论文的脉络，值得一读。

4、第四阶段 - 复现推荐论文开源代码，加深理解

读论文中你也许会有很多疑惑，如DeepFM这个Embedding如何共享的？DIN里面的Attention如何实现？解决这些疑惑的最好办法我认为不是读论文、百度别人写的博客，最好的方法就是去找开源的代码，试着复现也好，比着代码自己实现一遍也好，对你加深认识都有很大的帮助！

不管对一篇论文你看懂了还是没看懂也好，都去尝试复现一遍吧，真的很有帮助。

5、第五阶段 - 持续跟进最近推荐论文，思维发散

在不断跟进推荐系统论文的过程中，你会发现推荐系统会借鉴各个领域的方法，持续跟进最近推荐论文，对我们学习其他领域如NLP、图像领域、强化学习等等都会有所帮助。

干货！600页《推荐系统学习手册》（附下载链接及入门经验）

1.扫码关注下方 “小小挖掘机” 公众号

2.回复关键词：
推荐论文

小小挖掘机

推荐阅读

int
飞桨助力产业智能化：百度自研AI硬件深度融合

在2019中国国际智能产业博览会上，百度董事长兼CEO李彦宏强调，人工智能应务实推进其在各行业的应用。随后，在“ABC SUMMIT 2019百度云智峰会”上，百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]

蜡笔小新 2024-11-12 00:45:20
int
TypeScript 实战分享：Google 工程师深度解析 TypeScript 开发经验与心得

TypeScript 实战分享：Google 工程师深度解析 TypeScript 开发经验与心得 ... [详细]

蜡笔小新 2024-11-04 12:55:23
int
非计算机专业的朋友如何拿下多个Offer

大家好，我是归辰。秋招结束后，我已顺利入职，并应公子龙的邀请，分享一些秋招面试的心得体会，希望能帮助到学弟学妹们，让他们在未来的面试中更加顺利。 ... [详细]

蜡笔小新 2024-11-13 18:41:58
instance
Java反射机制详解及应用场景

本文详细介绍了Java反射机制的基本概念、获取Class对象的方法、反射的主要功能及其在实际开发中的应用。通过具体示例，帮助读者更好地理解和使用Java反射。 ... [详细]

蜡笔小新 2024-11-13 16:08:08
int
双指针法高效解决七道链表问题

双指针法在链表问题中应用广泛，能够高效解决多种经典问题，如合并两个有序链表、合并多个有序链表、查找倒数第k个节点等。本文将详细介绍这些应用场景及其解决方案。 ... [详细]

蜡笔小新 2024-11-13 13:16:55
int
深入理解ASCII、ANSI、GB2312、UNICODE及UTF-8、UTF-16编码

本文回顾了作者初次接触Unicode编码时的经历，并详细探讨了ASCII、ANSI、GB2312、UNICODE以及UTF-8和UTF-16编码的区别和应用场景。通过实例分析，帮助读者更好地理解和使用这些编码。 ... [详细]

蜡笔小新 2024-11-13 07:33:27
int
杜甫《喜晴》的两种英译比较

本文对比了杜甫《喜晴》的两种英文翻译版本：a. Pleased with Sunny Weather 和 b. Rejoicing in Clearing Weather。a 版由 alexcwlin 翻译并经 Adam Lam 编辑，b 版则由哈佛大学的宇文所安教授 (Prof. Stephen Owen) 翻译。 ... [详细]

蜡笔小新 2024-11-12 15:02:28
int
独家解析：深度学习泛化理论的破解之道与应用前景

本文深入探讨了深度学习泛化理论的关键问题，通过分析现有研究和实践经验，揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素，并提出了改进模型泛化性能的有效策略。此外，还展望了这些理论在实际应用中的广阔前景，为未来的研究和开发提供了宝贵的参考。 ... [详细]

蜡笔小新 2024-11-09 19:29:56
int
提升编程技能的10个专业建议

本文源自极分享，详细内容请参阅原文。技术债务如同信用卡负债，随着时间推移，修复成本会越来越高，因此程序员必须对此有深刻认识。此外，团队应致力于培养一种持续维护和优化代码的文化，以减少技术债务的累积。 ... [详细]

蜡笔小新 2024-11-04 12:27:07
hash
NoSQL 数据查询与检索技术解析

NoSQL数据库，即非关系型数据库，有时也被称作Not Only SQL，是一种区别于传统关系型数据库的管理系统。这类数据库设计用于处理大规模、高并发的数据存储与查询需求，特别适用于需要快速读写大量非结构化或半结构化数据的应用场景。NoSQL数据库通过牺牲部分一致性来换取更高的可扩展性和性能，支持分布式部署，能够有效应对互联网时代的海量数据挑战。 ... [详细]

蜡笔小新 2024-10-28 18:13:15
jar
Java Web Start应用中InvocationTargetException异常的深度解析与解决方案

Java Web Start应用中InvocationTargetException异常的深度解析与解决方案 ... [详细]

蜡笔小新 2024-10-22 11:21:14
数组
初级开发人员应探索的10项（免费）数据结构和算法课程

算法和数据结构是计算机科学中最基础和最重要的两个主题，在软件开发中无处不在。我坚信，对这两个主题的充分了解对于成为一名更好的程序员也很关键， ... [详细]

蜡笔小新 2024-10-18 21:11:44
int
lightgbm过去版本安装包_集成学习算法LightGBM

LightGBM在Kaggle，KDD等各类数据竞赛中，无论是分类问题还是回归问题亦或是排序问题，以GBDT（分类回归决策树 ... [详细]

蜡笔小新 2024-10-16 20:53:55
client
如何在PHP中准确获取服务器IP地址？

如何在PHP中准确获取服务器IP地址？ ... [详细]

蜡笔小新 2024-11-10 15:17:16
client
帝国CMS中的信息归档功能详解及其重要性

本文详细解析了帝国CMS中的信息归档功能，并探讨了其在内容管理中的重要性。通过归档功能，用户可以有效地管理和组织大量内容，提高网站的运行效率和用户体验。此外，文章还介绍了如何利用该功能进行数据备份和恢复，确保网站数据的安全性和完整性。 ... [详细]

蜡笔小新 2024-11-09 20:42:14

Tags | 热门标签

RankList | 热门文章