表格的扭曲矫正
在通过ocr对表格中的图像进行识别的时候发现,表格图像的定位是很重要的.虽然通过hough找直线,设低阈值,可以较高鲁棒性的找出表格的横线,但是表格如果存在一定程度的扭曲偏移,则检测切图的效果很差劲.看些论文发现,基于函数的,或者相机视角的矫正确实效果好.但是就目前的基于表格的应用来说还是越简单越好.

以上是矫正的效果图.思路很简单,
- 通过十字模板去匹配表格交点.
- 通过hough找出的直线的相对位置过滤掉不符合的交点.
- 通过按列按行,对与交点进行排序
- 通过交点的均值,找出标准网格中,交点的排布位置
- 遍历网格,对网格单元进行从原图像到标准图像的映射转换