深度学习数据增强方法总结

前言

在计算机视觉领域中,为了提高深度神经网络模型的泛化性能,更好地适应的环境和工况,在模型的训练过程中常常会用到数据增强算法。这篇博客将总结分享现有的一些数据增强方法。

增强方法 适用领域
Flip 分类、检测、分割
Rotation 分类、分割
Resize 分类、检测、分割
Croping 分类、检测、分割
Noise 分类、检测、分割
Color distortions 分类、检测、分割
Geometric distortions 分类、分割
Random erase、 CutOut 分类、检测
Hide-and-seek 分类、检测
Gridmask 分类、检测
Mixup 分类、检测
CutMix 分类、检测

Flip

对图像进行水平翻转或者垂直翻转。
深度学习数据增强方法总结

Rotation

将图像绕着某个点旋转一定的角度。
深度学习数据增强方法总结

Resize

对图像进行缩放,以保证模型具有尺度不变性。
深度学习数据增强方法总结

Croping

对图像进行随机裁剪,只截取部分图像进行训练(语义分割中经常用到)。
深度学习数据增强方法总结

Noise

在图像中加入噪音。
深度学习数据增强方法总结

Color distortion

通过在不同颜色空间下调整不同的颜色分量,以对颜色进行改变。
深度学习数据增强方法总结

Geometric distortions

对图像进行仿射变换、透视变换或者进行局部扭曲,得到扭曲的图像。
深度学习数据增强方法总结

Random erase、CutOut

对图像中随机选取一个矩形区域用特定的值(随机值或者数据均值)进行覆盖。
深度学习数据增强方法总结

Hide-and-seek

对图像进行网格划分,选取其中部分网格用特定值进行填充。
深度学习数据增强方法总结

Gridmask

与Hide-and-seek类似,也是先对图像划分网格,有规律地、均匀地选取部分区域进行填充。
深度学习数据增强方法总结

Mixup

输入两张图像,对两张图像和对应标签进行线性叠加。
深度学习数据增强方法总结

CutMix

在Mixup和CutOut的基础上,将图像中的某一区域去除,填充成另一图像。
深度学习数据增强方法总结

总结

数据增强的目的提高模型的泛化性能,但要根据实际情况选择合适的数据增强算法,否则将事与愿违。