FasterRCNN训练自己的数据集2

  尝试用FasterRCNN做版面分析,由于缺少大量的标注数据,手动标注数据量少也不起什么作用,鉴于之前做过版面分析,且效果还行,之前版面分析效果图见:

OCR版面分析效果图(一)

OCR版面分析效果图(二)

      考虑使用之前的处理结果(去除效果差的)做标注数据(由于我之前的版面处理中文本不是按文本段落切分的,而是以文本行切分,而每页文本行数目又太多,大小情况比较复杂,所以暂时不把文本行作为检测对象,只加入了图片、表格、公式3类)。

      最近增加了一些数据集,重新进行了训练,效果略有提升。此次用了约15000张图进行训练,经过约9万次训练后,得出的检测效果如下:

FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 FasterRCNN训练自己的数据集2

FasterRCNN训练自己的数据集2 

FasterRCNN训练自己的数据集2