利用GNN基于RL的机器人序列化结构迁移学习

采用RL(reward是机器人末端到target的distance)的机器人结构迁移学习是发展型机器人的萌芽阶段,目前采用GNN去表征policy,把机器人的关节点作为GNN的node,机器人的身体躯干作为GNN的vertice,采用三个update和aggregate函数更新node和vertice。然后采用高结构的机器人结构进行预训练,然后降结构成低结构的机器人进行结构迁移。
innovations:

1. Improved GNN :weighted Aggregation functions
2. 结构迁移:高结构作为预训练,低结构作为任务结构机器人

利用GNN基于RL的机器人序列化结构迁移学习

利用GNN基于RL的机器人序列化结构迁移学习

利用GNN基于RL的机器人序列化结构迁移学习

利用GNN基于RL的机器人序列化结构迁移学习