【学霸笔记】AlphaGo之父David Silver的强化学习经典课程笔记
聚焦AI干货,关注:决策智能与机器学习
AlphaGo之父David Silver的强化学习经典课程前文已有介绍,本想自己整理一下课程的学习笔记,但发现已经有学霸整理的很完善,不做东施效颦之举,在此分享给大家。
叶强的David Silver强化学习公开课中文讲解及实践
地址:https://zhuanlan.zhihu.com/reinforce
PDF版本笔记下载,请在公众号回复:20200223
目录
写在最前面——关于连载David Silver《强化学习》视频公开课的中文学习笔记
《强化学习》第一讲 简介
《强化学习》第二讲 马尔科夫决策过程
《强化学习》第三讲 动态规划寻找最优策略
《强化学习》第四讲 不基于模型的预测
《强化学习》第五讲 不基于模型的控制
《强化学习》第六讲 价值函数的近似表示
《强化学习》第七讲 策略梯度
《强化学习》第八讲 整合学习与规划
《强化学习》第九讲 探索与利用
强化学习实践一 迭代法评估4*4方格世界下的随机策略
强化学习实践二 理解gym的建模思想
强化学习实践三 编写通用的格子世界环境类
强化学习实践四 Agent类和SARSA算法实现
强化学习实践五 SARSA(λ)算法实现
强化学习实践六 给Agent添加记忆功能
强化学习实践七 DQN的实现
David Silver强化学习学习笔记及编程实践合集
初步认识AlphaGo Zero原理
陈雄辉的强化学习基础David Silver笔记
目前只涉及1-7讲内容,地址:https://zhuanlan.zhihu.com/c_135909947
目录
1. 强化学习概述( Introduction to Reinforcement Learning)
2. 马尔科夫决策过程(MDPs)
3. 动态规划(Planning by Dynamic Programming)
4. 免模型预测(Model-Free Prediction)
5. 免模型决策(Model-Free Control)
6. 值函数近似(Value Function Approximation)
7. 策略梯度(Policy Gradient)
交流合作
请加微信号:yan_kylin_phenix,注明姓名+单位+从业方向+地点,非诚勿扰。