强化学习-在线可视化-值迭代-karpathy

强化学习-在线可视化-值迭代-karpathy

前言:

之前因为好奇值迭代的具体过程,所以搜了一下可视化的工具和内容。
发现了这个特别好使的网页!
虽然我自己也写了一个简版的格子世界,值迭代可视化版本,但是和这个相比,启动起来还是太麻烦了…
等我有空开源一下~

但是半年后的今天,我竟然忘了这个网页叫啥来着,搜了好久,才找到。

想着在博客记录一下,才好

网页链接:

https://cs.stanford.edu/people/karpathy/reinforcejs/gridworld_td.html

可以设置单点的奖励值,可以设置探索度,非常方便,直观。
没玩过的,强烈建议玩一玩~

强化学习-在线可视化-值迭代-karpathy