撒花!港中文周博磊--强化学习课程完结(附课件下载!)
【导读】 从三月中旬开始到现在,历时整整两个多月时间,每周录制和剪辑一课视频,周末至少投入大半天时间,周博磊大牛终于独自一人把这门《强化学习纲要》整理完成。这可能也是全网第一个中文强化学习课程。超级赞,感谢大牛的课程分享,下面视频齐刷刷放一起,还没看的各位RLer们,快去看起来!(文末附视频链接和课件打包下载!)
个人简介
周博磊: 2010年本科毕业于上海交通大学,2012年硕士毕业于香港中文大学,2018年博士毕业于麻省理工学院,现任香港中文大学信息工程系助理教授。
研究方向主要为机器感知和决策,重点是通过学习可解释、结构化的表征,使机器能够在复杂的环境中感知、推理和行动。
获奖荣誉:
-
MIT Technology Review 2020年亚太地区35岁以下的创新者
-
Facebook PyRobot:Democratizing Robotics Research Award2019
-
Facebook博士2016-2018年计算机视觉研究金
-
2017年BRC奖学金
-
麻省理工学院Ho-Ching and Han-Ching Fund Award 2013
-
麻省理工学院大中华计算机科学奖学金2013
-
香港中文大学2012年度杰出论文奖
-
2011年微软亚洲研究金
-
香港中文大学研究生奖学金2010-2012
-
上海交通大学2010年度优秀本科生论文
更多信息,详见个人主页:http://bzhou.ie.cuhk.edu.hk/
强化学习课程目录
-
概括与基础
-
马尔科夫决策过程
-
无模型的价值函数估计和控制
-
价值函数的近似
-
策略优化基础
-
策略优化进阶
-
基于环境模型的 RL 方法
-
模仿学习
-
RL 分布式系统
-
完结篇
部分课件pdf展示
传送门下载
为了方便大家学习,我已将所有课程PPT打包下载好!请关注深度学习技术前沿公众号
- 后台回复“RL2020” 就可以获取**《港中文周博磊强化学习纲要》视频链接和课程PPT资料**
欢迎各位RLer加入强化学习微信交流大群,本群旨在交流强化学习框架、策略梯度、DQN、理论推导与算法实现、前沿技术与顶会文章解读、应用场景等内容。更有求职内推、算法竞赛、资源干货、业界前沿资讯等,欢迎加群交流学习!
进群请备注:研究方向+学校/公司+昵称(如强化学习+上交+王明)