如何在colab中调用VOC数据集
我这里使用的数据集是VOC2007。
首先把数据集上传到colab云端硬盘。
上传后各文件夹如下:
然后新建.ipynb文件使用torchvision.datasets.VOCDetection()进行调用:
import os
from google.colab import drive
import torchvision.datasets as datasets
drive.mount(’/content/drive’) #加载硬盘,按照提示输入验证码
path = “/content/drive/My Drive/VOC2007” #添加路径
os.chdir(path)
os.listdir(path)
voc_trainset = datasets.VOCDetection(path,year=‘2007’, image_set=‘train’, download=False)
print(len(voc_trainset))
image, annotation = voc_trainset[0][0],voc_trainset[0][1]
print(annotation)
show_image = np.array(image)
plt.imshow(show_image)
plt.show()
输出结果如下:
可以看出,image_set=‘train’数据集中第一个图片的filename’: ‘000012.jpg’。
这也从train.txt文件中得到了验证。第一个图片为000012。
可能有些人对 voc_trainset[0][0],voc_trainset[0][1]有些疑惑,我们在colab中输入:
这样就很清晰了。
voc_trainset[0][0]即为RGB格式图片;voc_trainset[0][1]为一个字典,是其“Annotations“标签内容。不信的话打开000012.xml文件一探究竟吧。
好的,使用torchvision.datasets.VOCDetection()调用VOC2007的方法就给大家介绍到这里。