您的位置: 首页 > 文章 > 《强化学习》近似值函数方法

《强化学习》近似值函数方法

分类: 文章 • 2024-01-08 10:35:04

强化学习和监督学习

表格方法的局限

《强化学习》近似值函数方法

RL中的函数近似

《强化学习》近似值函数方法

监督学习-MC

《强化学习》近似值函数方法

MC—TD

《强化学习》近似值函数方法

基于值函数的RL损失函数

《强化学习》近似值函数方法

近似方法的一些困难

Deep Q-Network

《强化学习》近似值函数方法

经验回放

《强化学习》近似值函数方法

目标网络

《强化学习》近似值函数方法

奖励裁剪

《强化学习》近似值函数方法

DQN的一些问题和解决

Q值自相关问题

《强化学习》近似值函数方法

Q值过度估计

《强化学习》近似值函数方法

优先经验回放

《强化学习》近似值函数方法

Bootstrap DQN

《强化学习》近似值函数方法

部分可见性

《强化学习》近似值函数方法