您的位置: 首页 > 文章 > 【Tom M. Mitchell课件】机器学习——强化学习(1)

【Tom M. Mitchell课件】机器学习——强化学习(1)

分类: 文章 • 2024-12-26 20:38:46

本课件主要内容包括：

强化学习
强化学习：西洋双陆棋
强化学习问题
马尔科夫决策过程
HMM，马尔科夫过程，马尔科夫决策过程
自主智能体的强化学习任务
每种策略的值函数
值迭代方法
Q学习
学习Q的训练准则
更新策略
不确定情况
时间差分学习
MDP与RL
MDP与强化学习的未来研究方向

【Tom M. Mitchell课件】机器学习——强化学习(1)

【Tom M. Mitchell课件】机器学习——强化学习(1)

【Tom M. Mitchell课件】机器学习——强化学习(1)

完整课件下载地址：

http://page2.dfpan.com/fs/flcj42211291c6efe78/

更多精彩文章请关注微信号：【Tom M. Mitchell课件】机器学习——强化学习(1)