MSRA-TD500数据集(MSRA Text Detection 500 Database)

RRPN(《Arbitrary-Oriented Scene Text Detection via Rotation Proposals》)是文本检测中比较具有代表性的文章，文章地址：https://arxiv.org/pdf/1703.01086.pdf。

文章里面用到了MSRA-TD500数据集，数据集特点：多方向文本检测、大部分文本都在引导牌上、分辨率在1296x864到1920x1280之间、包含中英文、总共500张自然场景图片(Training 300 + Test 200)、标注以行为单位，而不是单词、每张图片都完全标注. 难以识别的有difficult标注。

数据集下载地址：http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_%28MSRA-TD500%29

在数据集下载之后，里面包含一个word：MSRA Text Detection 500 Database (MSRA-TD500) Readme.doc，详细介绍了数据集。

MSRA文本检测500数据库（MSRA-TD500）作为评估文本检测算法的基准被公开收集和发布，目的是跟踪自然图像中文本检测领域的最新进展，尤其是检测任意文本的进展，MSRA文本检测500数据库（MSRA-TD500）包含500个自然图像，使用数据包相机从室内（办公室和商场）和室外（街道）场景拍摄，室内图像主要是标志，门板和警示牌，而室外图像主要是复杂背景下的导板和广告牌。图像的分辨率从1296x864到1920x1280不等。由于文本的多样性和图像背景的复杂性，数据集非常具有挑战性。文本可以是不同的语言（中文，英文或两者的混合），字体，大小，颜色和方向。背景可能包含植被（例如树木和草）和重复的图案（例如窗户和砖块），这些图案与文字不太明显。

数据集分为两部分：训练集和测试集。训练集包含从原始数据集中随机选择的300个图像，其余200个图像构成测试集。此数据集中的所有图像都已完全注释。此数据集中的基本单位是文本行，而不是ICDAR数据集中使用的单词，因为很难根据空格将中文文本行划分为单个单词；即使对于英文文本行，在没有高级信息的情况下执行字分区也是非常重要的。

MSRA-TD500数据集(MSRA Text Detection 500 Database)

MSRA-TD500数据集(MSRA Text Detection 500 Database)

相关推荐