研一汇报第五周(待完成)
论文:《VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION》 Karen Simonyan∗ & Andrew Zisserman+ University of Oxford
主要内容
研究了卷积网络深度在大规模图像识别环境中对其准确性的影响,使用(3×3)卷积滤波器对增加深度的网络进行全面评估,通过将深度推至16-19层可以实现对现有技术配置的重大改进。
convNet配置的通用布局:
分类实验
数据集: ILSVRC-2012 dataset (which was used for ILSVRC 2012–2014 chal- lenges). The dataset includes images of 1000 classes
数据集划分: training (1.3M images), validation (50K images), and testing (100K images with held-out class labels).
尺度评估
训练时的标度抖动(S∈[256; 512])也会比在最小边固定的图像上进行训练(S = 256或S = 384)产生更好的结果。
通过范围设定值,比固定尺度进行训练集增强有助于捕获多尺度图像统计信息。
1、单尺度评估
S ∈ [256; 512]
Q = 0.5(Smin + Smax) 256 or 384
2、多尺度评估
S ∈ [Smin; Smax]
Q = {Smin, 0.5(Smin + Smax), Smax}.
3、多交叉验证
S ∈ [256, 512] Q = {256, 384, 512}.
“VGG-19”对比结果
结论
深度有利于提高大规模图像分类的精度。