您的位置: 首页 > 文章 > notes2-- 深度强化学习入门到熟练（Shusen Wang）

notes2-- 深度强化学习入门到熟练（Shusen Wang）

分类: 文章 • 2024-01-06 21:40:40

Value-based Learning 价值学习

回顾

notes2-- 深度强化学习入门到熟练（Shusen Wang）

Deep Q network (DQN)

使用神经网络近似 $Q^{*}$ 函数 Approximate the Q Funcition
notes2-- 深度强化学习入门到熟练（Shusen Wang） DQN in Super Mario

Temporal difference(TD)

notes2-- 深度强化学习入门到熟练（Shusen Wang）

TD learning for DQN
Summary