无人驾驶之概率机器人,附加部分,及强化学习试卷
注:本卷为内部用卷,供大家检验学习成果用,如需商业化请私聊我,谢谢!
注:本卷可结合博文的考纲使用
一、 填空题(60分,定义,区别2分,其他1分)
- 概率机器人与传统机器人相比的优势在于___________________________________,
________________________________。 - 概率机器人即近视醉酒倒霉机器人,近视表现为____________________________,
醉酒表现为________________________,倒霉表现为____________________________。 - 多维高斯分布表达式为___________________,其协方差表示___________________。
- 满足马尔可夫假设即________________________________________________________。
- 高斯参数滤波方法有______________, __________, __________。非参数滤波方法有
____________, ____________。 - IF算法相比KF算法的优点是________________________________________________。
- 密度树的定义是_____________________________________________________________,
- 选择更新的方法是___________________________________________________________。
- 静态二值贝叶斯滤波的表达式是______________________________,公式中各部分的意义是____________________________________________________________________,
它在建图中的应用思想是____________________________________________________。 - 三角形分布的表达式是______________________________。
- 估计一致性的定义是________________________________________________________。
- 对称环境测试是指___________________________________________________________。
- AMCL实质是__________和____________原理的叠加加上对粒子流分布的限制。
- 可以用于行为克隆的是____________模型,正演模型用MAP的原因是_________,
_________________________________________。 - Gmapping的G指的是____________, 其定位用的是_______滤波。
- Qlearning与sarsa的区别是__________________________________________________。
- 强化学习根据需要亲身经历分为__________与__________。根据更新方法分为__________与___________。根据策略是否相同分为_____________与_____________。根据时间是否同步分为_________与_________。
- sarsa的收敛条件是________________,sarsa(langda)与之的区别是__________________。
- 交叉熵的定义式是__________________,
- POMDP的定义是___________________________________________________________。
二、 应用题(170分)
21. 解释下图各个部分的意义(14分)
23.高斯滤波系的KF系在机器人定位中有着重要应用,请回答下列问题。(25分)
(1)解释2-7的意义(6分)
(2)解释2-14的意义(13分)
(3)KF,EKF,UKF的区别是什么,影响EKF,UKF的性能的主要因素分别是什么?(6分)
-
粒子滤波是目前比较流行滤波方法,请回答下列问题。(44分)
(1) 解释2-20的意义(19分)
(2) 解释2-20的意义(19分)
(3) 上述两者有什么区别?(6分) -
在机器人感知中,我们常常用到波速模型表示测量的置信分布,试回答下列问题。(16分)
(1)画出波束模型的四大组成部分及最后的综合模型并写出这5个图形的数学表达式。(10分)
(2) 如下图,圆是激光雷达,方块是障碍物,根据波束模型大致画出障碍物的似然域分布。(6分)
25. 强化学习目前结合深度学习产生了许多结合的变种,如DDPG(深度+确定+policy gradients),DQN(深度网络+Qlearning),A3C,DDPO等,请回答下列问题。(41分)
(1) 简述DQN的基本思想,其相比QLearing有哪些改进?(8分)
(2) DQN有哪些变种,其变种的改进部分及优势是?(9分)
(3) DQN估计网络与真实网络的参数如何更新?与DDPG有哪些不同?(6分)
(4) 简述PG的基本思想,其与Qlearning有哪些不同?(8分)
(5) 在AC算法中,actor指的是?critic指的是?其基本思想是?(10分)
6.Gmapping的框图如图所示,请简述gmapping的原理。(15分)
7.已知路径规划分为局部路径规划及全局路径规划,请叙述任意两种局部路径规划的方法,并说明在全局路径规划中A*相比于迪杰斯特拉算法有何改进。(15分)
三、 计算题(70分)
-
已知一片栅格的直方图概率分布如下,其表示置信度的预测,若P(Zt|Xt)服从均值为(0,0),方差为(1,1),ρ为0.5的二维高斯分布,求其经过直方图滤波后的置信度直方图概率分布。并简述分辨率是什么,对直方图滤波有何影响(需归一化)(12分)
-
已知R矩阵如下图,Q矩阵默认为0,试迭代计算10次Q矩阵。衰减系数0.2,学习率0.1(10分)
-
试利用迪杰斯特拉算法计算下列图1到6的最短路径(15分)
-
已知 ,
(1)试将其推导成下列形式(18分)
(2)试考虑激光雷达地图的影响,将其推导成下列形式(要用到近似) 。(15分)