检测系列--YOLO系列
截图来自小象学院ppt,若侵权联系我删除
开头语:RCNN系列,需要区域候选框,即便最后是多任务损失函数,但回归和分类各是一块是很明显的,而yolo要把分类问题转换成回归,这样的話就全是回归。
一,yolo v1
1,介绍,此时输入size要一致448*448
2,框架,googlenet作为主干网络,但注意经过了一些改进,并没有用到多尺度
3,红色箭头是经改进的googlenet出来的,改进地方在于没有用googlenet多通路做法,而是1x1降维,3x3卷积提取,1x1升维
其中7x7是网格的划分,通道数30=(B*5+C),B是每个网格负责预测的目标个数,5是坐标+置信度,C是类别,每个bound box对应5个参数,B是用来确认是目标还是背景,与C的 每一类概率相乘来确认是哪一类
4,一个格子只预测两个bounding box
5,x,y,w,h要归一化到1
6.目标×属于每一类的概率得到最大可能性是哪一类
7.loss函数
8,NMS踢掉剩余的框
9,yolo策略
10,yolo v1效果,因为用到全连接,丢失空间信息故容易产生定位错误
二,yolo v2
1,加入bn。
2,取5个anchor boxes
待续。。。