【学霸笔记】AlphaGo之父David Silver的强化学习经典课程笔记

聚焦AI干货,关注:决策智能与机器学习

【学霸笔记】AlphaGo之父David Silver的强化学习经典课程笔记

AlphaGo之父David Silver的强化学习经典课程前文已有介绍,本想自己整理一下课程的学习笔记,但发现已经有学霸整理的很完善,不做东施效颦之举,在此分享给大家。

叶强的David Silver强化学习公开课中文讲解及实践

地址:https://zhuanlan.zhihu.com/reinforce

PDF版本笔记下载,请在公众号回复:20200223

目录

  • 写在最前面——关于连载David Silver《强化学习》视频公开课的中文学习笔记

  • 《强化学习》第一讲 简介

  • 《强化学习》第二讲 马尔科夫决策过程

  • 《强化学习》第三讲 动态规划寻找最优策略

  • 《强化学习》第四讲 不基于模型的预测

  • 《强化学习》第五讲 不基于模型的控制

  • 《强化学习》第六讲 价值函数的近似表示

  • 《强化学习》第七讲 策略梯度

  • 《强化学习》第八讲 整合学习与规划

  • 《强化学习》第九讲 探索与利用

  • 强化学习实践一 迭代法评估4*4方格世界下的随机策略

  • 强化学习实践二 理解gym的建模思想

  • 强化学习实践三 编写通用的格子世界环境类

  • 强化学习实践四 Agent类和SARSA算法实现

  • 强化学习实践五 SARSA(λ)算法实现

  • 强化学习实践六 给Agent添加记忆功能

  • 强化学习实践七 DQN的实现

  • David Silver强化学习学习笔记及编程实践合集

  • 初步认识AlphaGo Zero原理

陈雄辉的强化学习基础David Silver笔记

目前只涉及1-7讲内容,地址:https://zhuanlan.zhihu.com/c_135909947

目录

1. 强化学习概述( Introduction to Reinforcement Learning)

2. 马尔科夫决策过程(MDPs)

3. 动态规划(Planning by Dynamic Programming)

4. 免模型预测(Model-Free Prediction)

5. 免模型决策(Model-Free Control)

6. 值函数近似(Value Function Approximation)

7. 策略梯度(Policy Gradient)

交流合作

请加微信号:yan_kylin_phenix注明姓名+单位+从业方向+地点,非诚勿扰

【学霸笔记】AlphaGo之父David Silver的强化学习经典课程笔记