【Tom M. Mitchell课件】机器学习——强化学习(1)
本课件主要内容包括:
-
强化学习
-
强化学习:西洋双陆棋
-
强化学习问题
-
马尔科夫决策过程
-
HMM,马尔科夫过程,马尔科夫决策过程
-
自主智能体的强化学习任务
-
每种策略的值函数
-
值迭代方法
-
Q学习
-
学习Q的训练准则
-
更新策略
-
不确定情况
-
时间差分学习
-
MDP与RL
-
MDP与强化学习的未来研究方向
完整课件下载地址:
http://page2.dfpan.com/fs/flcj42211291c6efe78/
更多精彩文章请关注微信号: