热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

多伦多大学强化学习导论2022

课程描述这是一门关于不确定条件下强化学习和顺序决策的入门课程,重点在于理解理论基础。我们研究如何使用价值和策略迭代等动态规划方法来解决具有已知模型的顺序决策问题&#x

课程描述

    这是一门关于不确定条件下强化学习和顺序决策的入门课程,重点在于理解理论基础。我们研究如何使用价值和策略迭代等动态规划方法来解决具有已知模型的顺序决策问题,以及如何扩展这些方法来解决模型未知的强化学习问题。其他主题包括,RL中的函数逼近、策略梯度方法、基于模型的RL,以及探索和应用权衡。本课程将结合课堂讲授和学生阅读的经典和近期论文来讲授。由于重点是理解基础,你应该期望通过数学细节和证明。本课程的必修背景包括熟悉概率论和统计学、微积分、线性代数、最优化和(有监督的)机器学习。

    zyhq:多伦多大学《强化学习导论》课程(2022) 视频及ppt分享

课程首页

https://amfarahmand.github.io/IntroRL/

课程大纲


课程视频截图






zyhq: 

多伦多大学《强化学习导论》课程(2022) 视频及ppt分享

往期精品内容推荐

算法学的这么差,试用期你都过不了!

新书速递-《因果推理原理:基础与学习算法》分享

学术论文写作精典-《如何撰写优秀科研论文》书籍分享

2021ML实战新课-《深度学习速成课程2021》课程视频及ppt免费分享

NLP实战必读书籍-《基于Python的文本分析实战》免费pdf分享

问答系统超大公开数据集分类整理分享-附下载地址

深度学习中Attention Mechanism详细介绍:原理、分类及应用

神经网络视频/图像渲染相关经典论文、项目、数据集等资源整理分享

深度学习与自然语言处理-最新教材推荐


推荐阅读
author-avatar
jwbnmbnm
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有