deeplearning.ai 总结 - YOLO算法输出维度的计算方法
deeplearning.ai 总结 - YOLO算法输出维度的计算方法
flyfish
表示矩形区域是目标的概率,数值在0~1之间
表示目标中心位置坐标
表示目标所在矩形区域的高和宽
表示表示类别,有多少个类别就有多少个
图片左上角为原点,右下角为。
输出内容的列向量中先要包含以下6个部分
如果要同时检测两个目标,就设置两个Anchor Boxes
例如Anchor box 1检测人,Anchor box 2检测车。
计算方法
例如我们将图片分割成3*3的网格,算法可以识别3类目标(pedestrian, car, motorcycle),我们有两个Anchor Boxes
那么输出维度是
3*3*(5+3)*2
按照上图计算
就是
19*19*(5+80)5