多智能体强化学习

多智能体强化学习

学习链接

内容摘要

在即将来临的物联网时代,群体决策智能将称为一个研究重点。
传统上,博弈论研究的多个智能体的理性决策问题。它定义了动作、收益等博弈基本概念,侧重分析理性智能体的博弈结果,即均衡。然而,在很多现实问题中,博弈的状态空间和动作空间都很大,智能体的绝对理性是很难实现的,智能体往往处在不断的策略学习过程中。因此,近年来兴起的多智能体强化学习主要研究智能体策略的同步学习和演化问题,它在无人机群控制、智能交通系统、智能工业机器人等场景中具有很大的应用前景。

人工智能的发展趋势

智能感知----->智能决策------>智能群体决策
群体智能决策问题场景:游戏、工业场景(无人机群、交通系统、物流配送)、社会场景(区域经济预测)

博弈论

多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习

多智能体强化学习

多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习
开放性问题

多智能体强化学习
多智能体强化学习
多智能体强化学习
多智能体强化学习

研究展望

多智能体强化学习
多智能体强化学习