《Stereo Vision: Algorithms and Applications》——阅读笔记1【什么是立体视觉】
Stereo Vision:Algorithms and Applications阅读笔记记录
大纲
- 介绍立体视觉
- 立体视觉系统的概述
- 视觉对应算法
- 计算优化
- 硬件实现
- 应用
什么是立体视觉
是从两幅或者更多夫图片中判定出深度信息的技术。在计算机视觉领域中广泛研究的领域。这一技术涉及到双目立体系统、密集立体算法和立体视觉应用。强调是对实时/硬件实现的可行性方法。
单目相机
单目相机的点投影图
π是像平面
O是光心
有图显示,实点P和Q映射到了同一个点(p ≡ q),并且这条光上的每一个点都是这样,投影到像平面上同一个点,这就产生了视错觉。
双目相机
双目相机的点投影图
在两个相机下,如果我们在两幅图片上发现相应的点我们就可以通过三角测量来判断出深度了。
如何解决相应点问题
二维区域搜索???????
从左面的参考图中的一个点在右边的目标图片中找到相应的点,这样太浪费时间和资源了。不可采取。
极线区域搜索???????
通过极线约束来缩小搜索区域,仅在参考图上点所在的极线上在目标图片上搜索,这样搜索区域由二维变为一维,节约了时间和资源。
极线约束
极线约束就是:如图,在红色视线上点的对应点位于目标图像上图像平面上的绿色线上。
立体相机的标准化
我们知道相应点的搜索区域可以从二维缩减到一维,实际上,我们可以立体设备放在一个更加方便的标准的设置中——对应点可以被约束在同一条图像扫描线上。
原始图片:
标准化的图片:
图像能够很好的对齐并且焦距相同。
视差与深度
在立体设备标准化时,通过考虑相似三角形(POrOt and Ppp’)是视差。
视差是两个对应点的x坐标之差值,通常用灰度图像进行编码。
距离相机越近视差就越大
距离与视差的曲线图:
视区
给出带有极线 b 和焦距 f 的立体系统,那这个系统的视区将会被视差的范围[Dmin,Dmax]所限制。
将立体视觉系统测得的深度离散成平行平面,每一个平行面代表一个视差值。
通过亚像素技术可以实现更好的离散化。
此图的视区使用了5个视差值[Dmin,Dmin+4]。
用5个视差值[Δ+Dmin ,Δ+Dmin +4],,Δ > 0,视区将会更近并且缩小。