热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

推荐系统_干货!600页《推荐系统学习手册》(附下载链接及入门经验)

篇首语:本文由编程笔记#小编为大家整理,主要介绍了干货!600页《推荐系统学习手册》(附下载链接及入门经验)相关的知识,希望对你有一定的参考价值。这是之前学习推荐系统时的

篇首语:本文由编程笔记#小编为大家整理,主要介绍了干货!600页《推荐系统学习手册》(附下载链接及入门经验)相关的知识,希望对你有一定的参考价值。


这是之前学习推荐系统时的学习资料,非常全面,包含经典模型的解析及代码实现、模型的评估、最新工业界论文解读等等,全网仅此一份!该手册有PDF版本和Markdown版本,总计有600多页!


资料领取方式:




1.扫码关注下方 “小小挖掘机” 公众号






2.回复关键词:手册






小小挖掘机


经典模型解析及代码实现:


干货!600页《推荐系统学习手册》(附下载链接及入门经验)


干货!600页《推荐系统学习手册》(附下载链接及入门经验)


模型评价:

干货!600页《推荐系统学习手册》(附下载链接及入门经验)


最新工业界论文解读:


干货!600页《推荐系统学习手册》(附下载链接及入门经验)


再讲一下作者的推荐系统入门经验,大致可以分为以下五个阶段:



1、第一阶段 - 掌握机器学习基础知识,打好基础

学习推荐系统,还是要掌握一定的机器学习知识的,从特征获取、特征处理、特征选择,到基本的机器学习模型如逻辑回归、GBDT等等,都需要你熟练掌握。

其中比较重要的就是特征这块,因为推荐系统中会面临大量的离散特征,对离散特征的处理方式需要有一定的了解。

这里还是推荐李航博士的《统计学习方法第二版》。

然后就是神经网络,推荐系统中神经网络运用非常多,神经网络中基础的如循环神经网络、卷积神经网络,以及一些模型结构的搭建、训练的技巧如Dropout、BN等等也需要有所理解。

这个推荐吴恩达的深度学习课程以及李宏毅老师的深度学习课程。


2、第二阶段 - 阅读推荐系统经典书籍,入门推荐

推荐系统市面上的书不是很多,而且写得往往不够深入,仅能够起到一定的入门作用,毕竟推荐在各个公司还是比较核心的内容,是比较受到保护的。但经典的书籍还是有的,入门的话推荐两本。

一是大家所熟知的《推荐系统实践》,这本的话对于大家了解推荐系统中最基本的算法如协同过滤、推荐系统中常用的评价指标、使用上下文和社交网络进行推荐、如何解决冷启动问题都有一定的帮助。

二是最近市面上新出现的《推荐系统开发实战》一书,虽然这本书我还没有看过,但不少的群友反映这本书对于入门推荐系统来说十分友好。理论和实战相结合,是挺不错的一本“小白实操书”。

然后还有的一些书籍如《推荐系统与深度学习》和《推荐系统-技术、评估及高效算法》,大家感兴趣的话也可以进行阅读。


3、第三阶段 - 精度推荐系统经典论文,掌握诀窍

在理解基本的推荐知识之后,你大概会了解到推荐具体是做什么的,那么其问题又可以分成几个方面。如召回、CTR预估、Learning to Rank等等。这个时候我建议的话就是开始阅读经典论文了。下面整理一些我看过的比较经典的论文吧,可能有遗漏,也欢迎大家补充。

FM:《Factorization Machines》
FFM:《Field-aware Factorization Machines for CTR Prediction》
DeepFM:《DeepFM: A Factorization-Machine based Neural Network for CTR Prediction》
Wide & Deep:《Wide & Deep Learning for Recommender Systems》
DCN:《Deep & Cross Network for Ad Click Predictions》
NFM:《Neural Factorization Machines for Sparse Predictive Analytics》
AFM:《Attentional Factorization Machines:
Learning the Weight of Feature Interactions via Attention Networks》
GBDT + LR:《Practical Lessons from Predicting Clicks on Ads at Facebook》
MLR:《Learning Piece-wise Linear Models
from Large Scale Data for Ad Click Prediction》
DIN:《Deep Interest Network for Click-Through Rate Prediction》
DIEN:《Deep Interest Evolution Network for Click-Through Rate Prediction》
BPR:《BPR: Bayesian Personalized Ranking from Implicit Feedback》
Youtube:《Deep Neural Networks for YouTube Recommendations》

当然有些其他的论文也十分经典,咱们放在后面继续讲。

读论文也是需要一定的技巧,不同的人可能关注的点不一样,所以导致阅读重心不一样。对于我来说,我比较关注的点是这个论文要解决什么样的问题,是如何解决的,以及作者从哪几方面出发,使用什么评价指标来评判模型的好坏。至于效果,论文嘛,可信可不信,看看就好了。

最近上市的《深度学习推荐系统》也可以帮你快速梳理论文的脉络,值得一读。


4、第四阶段 - 复现推荐论文开源代码,加深理解

读论文中你也许会有很多疑惑,如DeepFM这个Embedding如何共享的?DIN里面的Attention如何实现?解决这些疑惑的最好办法我认为不是读论文、百度别人写的博客,最好的方法就是去找开源的代码,试着复现也好,比着代码自己实现一遍也好,对你加深认识都有很大的帮助!

不管对一篇论文你看懂了还是没看懂也好,都去尝试复现一遍吧,真的很有帮助。


5、第五阶段 - 持续跟进最近推荐论文,思维发散

在不断跟进推荐系统论文的过程中,你会发现推荐系统会借鉴各个领域的方法, 持续跟进最近推荐论文,对我们学习其他领域如NLP、图像领域、强化学习等等都会有所帮助。

干货!600页《推荐系统学习手册》(附下载链接及入门经验)





1.扫码关注下方 “小小挖掘机” 公众号






2.回复关键词:
推荐论文






小小挖掘机


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • JavaScript和Python是用于构建各种应用程序的两种有影响力的编程语言。尽管JavaScript多年来一直是占主导地位的编程语言,但Python的迅猛发展有 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了贝叶斯垃圾邮件分类的机器学习代码,代码来源于https://www.cnblogs.com/huangyc/p/10327209.html,并对代码进行了简介。朴素贝叶斯分类器训练函数包括求p(Ci)和基于词汇表的p(w|Ci)。 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • Opencv提供了几种分类器,例程里通过字符识别来进行说明的1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。函数原型:训练原型cv ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • plt python 画直线_机器学习干货,一步一步通过Python实现梯度下降的学习
    GradientDescent-梯度下降梯度下降法(英语:Gradientdescent)是一个一阶最优化算法,通常也称为最速下降法。要使用梯度下降法找 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
author-avatar
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有