PascalVOC2012目标检测数据集中的问题
PascalVoc2012的目标检测数据集一共有20类,每一类目标的具体情况如下:
person:17401个
aeroplane:1002个
tvmonitor:893个
train:704个
boat:1059个
dog:1598个
chair:3056个
bird:1271个
bicycle:837个
bottle:1561个
sheep:1084个
diningtable:800个
horse:803个
motorbike:801个
sofa:841个
cow:771个
car:2492个
cat:1277个
bus:685个
pottedplant:1202个
其中,Person这一类的目标框数量其实不止17401个,而是20474个,上面统计的是label,但是实际上,voc格式的数据集是容许一个标签有多个框的。如下所示,就是说这个公共数据集可能由于很多人一起标注,所以对同一个目标会标出大小不一样的框。而其他类就没有这个问题。所以其实要跑的话,这些框可能需要处理一下。如果我跑的话会可能写个代码把这些part删除掉。
常见问题
遮挡、标注不准确、目标过小、阴影等,这些常见的问题都有,如下图。