吴恩达深度学习——第四课第二周《深度卷积网络:case study》

2.10 数据增强

更多的数据或充足的数据对于计算机视觉任务是有帮助的。但当前CV的主要问题是无法得到充足的数据,或者说对于CV任务而言数据远远不够。数据增强是重要的帮助手段,常用的数据增强方法如下:

  • 垂直镜像:左右翻转
  • 随机裁剪:随机裁剪构成了很大一部分真实的图像,但也有可能随机裁剪的部分不含有目标,需要自行剔除。
  • 旋转、剪切等扭曲变形和局部弯曲。实际中这种技巧较复杂,使用较少
  • 颜色转换:给RGB三个通道加入不同的失真值
    • 色调变化,可以产生不同的样本。
    • 实践中,对RGB的变化是基于某些概率分布的,如PCA计算出哪些颜色成分较高,再进行颜色失真。
    • AlexNet中称为PCA颜色增强,若PCA颜色增强算法对于图片中的成分较少的颜色增减很多,而主成分颜色变化较少。
  • 10-crop:就是自己和镜像图像,裁剪四次。这是提高benchmark的一个技巧, 然后分类器对10个图像进行分类,对分类结果求平均,可能提高一点accuracy。这只是trick而已。

 

吴恩达深度学习——第四课第二周《深度卷积网络:case study》吴恩达深度学习——第四课第二周《深度卷积网络:case study》

吴恩达深度学习——第四课第二周《深度卷积网络:case study》吴恩达深度学习——第四课第二周《深度卷积网络:case study》