OCR手写字体生成数据

简述:

        根据CASIA的HWDB1.X的手写字符生成了一些带有字符级标注、行级别标注的文本数据,分享给需要的同学。

  1.  生成基于不同人的字体、字体大小、行间字体间隔、旋转角度、文本布局的文字贴图。
  2.  生成素材:共65种贴图背景, 由420位手写字体作者完成的71,122个符号, 1,609,136个汉字/3,866类。
  3.  数据量:Train:2597张, Test:662张,目前完了HWDB1.0部分,part2,part3如果需要后期可以继续制作。

字符素材:

OCR手写字体生成数据

数据示例:

OCR手写字体生成数据     OCR手写字体生成数据

字符级标注信息:

OCR手写字体生成数据

行级标注信息:

OCR手写字体生成数据

CASIA HWDB数据下载地址:http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html

欢迎加入OCR交流群,在群文件中可以直接领取生成数据~~~

OCR手写字体生成数据