迁移学习在多智能体强化学习领域的应用综述

本文主要对A Survey on Transfer Learning for Multiagent Reinforcement Learning Systems中的内容进行翻译,重组和摘要。预计两周的时间内完成。

 

背景

多智能体强化学习算法致力于解决,在环境中,智能体需要和其他智能体协作等复杂问题。因为强化学习算法取样的复杂度相当高,因此从零开始,去训练一个复杂的多智能体系统是十分消耗计算资源的,甚至是不可能完成的任务。迁移学习,为我们提供了可以从过往经验,或者其他智能体中学习知识的方法。在这篇综述中,我们论述了在多智能体知识重利用,以及跨智能体的知识重利用中最新的进展。

 

相关研究

 

迁移学习在多智能体强化学习领域的应用综述

这张图形象说明了本文的研究内容,即强化学习,迁移学习和多智能体学习的交叉处。

接下来我们先分别介绍这几个概念

强化学习:

1. 单智能体的强化学习:强化学习是解决马尔可夫过程问题的一种解法,具体它对问题的一些基本定义,解法,在这里就不再赘述,可以看这位大佬的系列文章,讲的真的很全了。

2. 多智能体的强化学习:参见原文的论述,在基本定义上,是和单智能体类似的,但是整个搜索空间是由所有智能体共同决定的。

 

未完待续