AIHGF

机器学习 - Data Augmentation 策略
Data Augmentation 策略 数据增强是提高模型性能和泛化能力的重要方法.深度学习数据增强策略主要有:...
扫描右侧二维码阅读全文
21
2018/05

机器学习 - Data Augmentation 策略

Data Augmentation 策略
数据增强是提高模型性能和泛化能力的重要方法.

深度学习数据增强策略主要有:

  • 随机调整 - Random resize
  • 平移 - Shift
  • 水平/垂直翻转 - Horizontal/Vertical flip
  • Rotation/Reflection 旋转/仿射变换
  • Noise - 高斯噪声,模糊处理

  • 颜色增强 - Color Augmentation,包括色彩饱和度、亮度和对比度等.

  • PCA Jittering

    首先,按照 RGB 三个颜色通道计算均值和方差,规范网络输入数据;

    然后,计算整个训练数据集的协方差矩阵,进行特征分解,得到特征向量和特征值,以作 PCA Jittering.

  • 随机图像插值 - Random Image Interpolation,主要是在图像裁剪和缩放时采用.

  • 裁剪采样 - Crop Sampling,从原始图像中缩放裁剪,得到网络输入. 常用有两种方式:


    Scale Jittering,如 VGG 和 ResNet;


  • 尺度和长宽比增强变换 - Scale and aspect ratio augmentation,如 Google Inception 网络; 其缺点:随机选择 crop center 时,可能出现选择的区域不包含目标物体的区域.


  • 监督数据增强 - Supervised Data Augmentation(SDA) (海康威视2016提出)

  • 类别标签不均衡问题 - Imbalanced Class Problem.

    数据集中各类别所包含的样本数可能很不均匀,有的类别包含样本数很多,有的类别包含样本数很少.

    海康威视2016 受 Class-Aware Sampling方法启发提出 Label Shuffling/Label Smoothing 策略.

Reference

[1] - 深度学习大讲堂 - 海康威视研究院ImageNet2016竞赛经验分享

[2] - 使用深度学习(CNN)算法进行图像识别工作时,有哪些data augmentation 的奇技淫巧? - 知乎

[3] - 深度学习之图像的数据增强

Last modification:October 9th, 2018 at 09:31 am

Leave a Comment