您的位置: 首页 > 文章 > 【Tom M. Mitchell课件】机器学习——强化学习(2)

【Tom M. Mitchell课件】机器学习——强化学习(2)

分类: 文章 • 2024-12-26 20:07:52

本课件主要内容包括：

HMM，马尔可夫过程，马尔可夫决策过程
非确定的情况
时间差分学习
MDP与RL
MDP与强化学习：未来发展方向
关于动物的强化学习？
人类学习的RL模型
大脑的RL理论
时间差ML模型：预测学习过程中多巴胺能神经元活性

【Tom M. Mitchell课件】机器学习——强化学习(2)

【Tom M. Mitchell课件】机器学习——强化学习(2)

【Tom M. Mitchell课件】机器学习——强化学习(2)

完整课件下载地址：

http://page2.dfpan.com/fs/6l6c1j12a211f249163/

更多精彩文章请关注微信号：【Tom M. Mitchell课件】机器学习——强化学习(2)