学习笔记(08):决胜AI-强化学习实战系列视频课程-DeepQnetwork原理
立即学习:https://edu.****.net/course/play/4916/88705?utm_source=blogtoedu
Deep Q-network
用4帧表示一个state.
84*84*4 当前state包含这么多像素 x(0-255)
做不出这么大的Q-table用来训练。
用Q-table做不了,用Network来充当Q-table.
要维护的不再是Q-table, 而是一个network.