分享深入浅出强化学习原理入门+源码

郭宪博士2017年写的《深入浅出强化学习:原理入门》,是强化学习入门级别的书,语言通俗易懂

        深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。从最基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题最基本的方法——动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。最后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。除了系统地介绍基本理论,还介绍了相应的数学基础和编程实例。既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。
分享深入浅出强化学习原理入门+源码

 分享下自己关于本书的笔记和资料

https://pan.baidu.com/s/1Nr2Ik-blx8v5JrcznAEc8g&shfl=sharepset