深度学习(day4)
深度学习(day4)
Classification and Location:
- fune tune 用训练好的网络进行改变,比如最后一层全连接层中改为分10类,只需改个参数就行
- 一般都要进行对图片进行规模scale放大,对每一个scale大小做一次滑动窗口的过程。检测不同大小的物体,放大后,滑动窗口可能检测只是图像的一部分或者是背景。
Object Detection
- 不通过滑动窗口,这会需要大量的位置和规模。不需要通过一个一个的滑动,因为这可能是一些无用的背景。
- 通过有选择性的窗口
- 通过像素的相似值
- 把小区域合并
- 再把区域合并
- 选出特定的候选框,分类或者回归的任务
- RCNN
- Fast R-CNN
- Faster R-CNN详情参考
Design Conv Network
- 使用小的卷积核,使用多层卷积,会有更小参数个数,多层卷积都会有**函数,提高非线性化。提高检测能力
- pooling 对图片进行压缩,最主要的原因还是便于网络进行计算,使网络能更快的收敛
- pooling后特征图大小变小,表达能力可能就会变弱
- 提高深度,pooling之后,卷积核个数翻倍。就会使特征图深度翻倍
Data Augmentation
- data越多越好,保持label不变的情况下进行图像变换
- 先进行图像的预处理,数据增强
- 以下预处理,随机的结合
- 裁剪crop
- 放大缩小scale
- 旋转rotation
- 平移translate
- 拉伸stretch
- 等
Transfer Learning
- 借鉴别人已经训练好的model,如只改变最后的参数,调低学习率等微调