VOC数据集 XML 和 txt标注文本的理解
VOC数据集 XML 和 txt标注文本的理解
以VOC数据集中VOC2007中的000001.jpg图片为例,分析下其对应的Annotations文件夹下的000001.xml文件和labels文件夹下的000001.txt文件
整幅图片的尺寸为
宽353,高500.
XML文件中:
353*500 是这张000001.jpg图片的宽和高object狗在图片中左上角坐标为(48,240),右下角坐标为(195,371)object人在图片中左上角坐标为(8,12),右下角坐标为(352,498)
在voc.name文件中:
object狗所在的ID为11;
object人所在的ID为14;
txt文件中:
类别一
11 0.341359773371 0.609 0.416430594901 0.262
其中,
11是【 ID】:object狗,
0.341359773371 :【中心点X的比例标注】,353*0.341359773371 = 120.5 pixel, 约等于图像中的直接计算值:(195-48)/2 + 48 = 121.5
0.609 :【中心点Y的比例标注】 500*0.609=304.5, 约等于图像中的直接计算值: (371-240)/2 + 240 = 305.5
0.416430594901: 【BOX宽比例标注】(195-48)/353 = 0.4164
0.262: 【BOX高比例标注】(371-240)/500 = 0.262
类别二
14 0.507082152975 0.508 0.974504249292 0.972
14是 【ID】:object人
后面四个数值代表的意义与计算方式同上,依次是
【中心点X的比例标注】
【中心点Y的比例标注】
【BOX宽比例标注】
【BOX高比例标注】