MSRA-TD500数据集(MSRA Text Detection 500 Database)

       RRPN(《Arbitrary-Oriented Scene Text Detection via Rotation Proposals》)是文本检测中比较具有代表性的文章,文章地址:https://arxiv.org/pdf/1703.01086.pdf

       文章里面用到了MSRA-TD500数据集,数据集特点:多方向文本检测、大部分文本都在引导牌上、分辨率在1296x864到1920x1280之间、包含中英文、总共500张自然场景图片(Training 300 + Test 200)、标注以行为单位,而不是单词、每张图片都完全标注. 难以识别的有difficult标注。

MSRA-TD500数据集(MSRA Text Detection 500 Database)

MSRA-TD500数据集(MSRA Text Detection 500 Database)

数据集下载地址:http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_%28MSRA-TD500%29

       在数据集下载之后,里面包含一个word:MSRA Text Detection 500 Database (MSRA-TD500) Readme.doc,详细介绍了数据集。

       MSRA文本检测500数据库(MSRA-TD500)作为评估文本检测算法的基准被公开收集和发布,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测任意文本的进展,MSRA文本检测500数据库(MSRA-TD500)包含500个自然图像,使用数据包相机从室内(办公室和商场)和室外(街道)场景拍摄,室内图像主要是标志,门板和警示牌,而室外图像主要是复杂背景下的导板和广告牌。图像的分辨率从1296x864到1920x1280不等。由于文本的多样性和图像背景的复杂性,数据集非常具有挑战性。文本可以是不同的语言(中文,英文或两者的混合),字体,大小,颜色和方向。背景可能包含植被(例如树木和草)和重复的图案(例如窗户和砖块),这些图案与文字不太明显。

      数据集分为两部分:训练集和测试集。训练集包含从原始数据集中随机选择的300个图像,其余200个图像构成测试集。此数据集中的所有图像都已完全注释。此数据集中的基本单位是文本行,而不是ICDAR数据集中使用的单词,因为很难根据空格将中文文本行划分为单个单词;即使对于英文文本行,在没有高级信息的情况下执行字分区也是非常重要的。

MSRA-TD500数据集(MSRA Text Detection 500 Database)