深度学习数据增强方法总结
前言
在计算机视觉领域中,为了提高深度神经网络模型的泛化性能,更好地适应的环境和工况,在模型的训练过程中常常会用到数据增强算法。这篇博客将总结分享现有的一些数据增强方法。
增强方法 | 适用领域 |
---|---|
Flip | 分类、检测、分割 |
Rotation | 分类、分割 |
Resize | 分类、检测、分割 |
Croping | 分类、检测、分割 |
Noise | 分类、检测、分割 |
Color distortions | 分类、检测、分割 |
Geometric distortions | 分类、分割 |
Random erase、 CutOut | 分类、检测 |
Hide-and-seek | 分类、检测 |
Gridmask | 分类、检测 |
Mixup | 分类、检测 |
CutMix | 分类、检测 |
Flip
对图像进行水平翻转或者垂直翻转。
Rotation
将图像绕着某个点旋转一定的角度。
Resize
对图像进行缩放,以保证模型具有尺度不变性。
Croping
对图像进行随机裁剪,只截取部分图像进行训练(语义分割中经常用到)。
Noise
在图像中加入噪音。
Color distortion
通过在不同颜色空间下调整不同的颜色分量,以对颜色进行改变。
Geometric distortions
对图像进行仿射变换、透视变换或者进行局部扭曲,得到扭曲的图像。
Random erase、CutOut
对图像中随机选取一个矩形区域用特定的值(随机值或者数据均值)进行覆盖。
Hide-and-seek
对图像进行网格划分,选取其中部分网格用特定值进行填充。
Gridmask
与Hide-and-seek类似,也是先对图像划分网格,有规律地、均匀地选取部分区域进行填充。
Mixup
输入两张图像,对两张图像和对应标签进行线性叠加。
CutMix
在Mixup和CutOut的基础上,将图像中的某一区域去除,填充成另一图像。
总结
数据增强的目的提高模型的泛化性能,但要根据实际情况选择合适的数据增强算法,否则将事与愿违。