课程描述
这是一门关于不确定条件下强化学习和顺序决策的入门课程,重点在于理解理论基础。我们研究如何使用价值和策略迭代等动态规划方法来解决具有已知模型的顺序决策问题,以及如何扩展这些方法来解决模型未知的强化学习问题。其他主题包括,RL中的函数逼近、策略梯度方法、基于模型的RL,以及探索和应用权衡。本课程将结合课堂讲授和学生阅读的经典和近期论文来讲授。由于重点是理解基础,你应该期望通过数学细节和证明。本课程的必修背景包括熟悉概率论和统计学、微积分、线性代数、最优化和(有监督的)机器学习。
zyhq:多伦多大学《强化学习导论》课程(2022) 视频及ppt分享
课程首页
https://amfarahmand.github.io/IntroRL/
课程大纲
课程视频截图
zyhq:
多伦多大学《强化学习导论》课程(2022) 视频及ppt分享
往期精品内容推荐
算法学的这么差,试用期你都过不了!
新书速递-《因果推理原理:基础与学习算法》分享
学术论文写作精典-《如何撰写优秀科研论文》书籍分享
2021ML实战新课-《深度学习速成课程2021》课程视频及ppt免费分享
NLP实战必读书籍-《基于Python的文本分析实战》免费pdf分享
问答系统超大公开数据集分类整理分享-附下载地址
深度学习中Attention Mechanism详细介绍:原理、分类及应用
神经网络视频/图像渲染相关经典论文、项目、数据集等资源整理分享
深度学习与自然语言处理-最新教材推荐