yolact问答

1. yolact的识别帧率是多少

resnet50可以42fps

2.yolact为什么比maskrcnn等快, 为什么能实时?

  yolact 的模板分支,和 rpn分支是并行的,没有依赖,合并就出mask。maskrcnn要等到rpn算完了,才能取到feature,然后做mask。

2.5  maskrcnn如何使用roialign解决空间连续性问题?

  卷积层每次计算都是空域相关的。而fasterrcnn里面,roi 是计算的xywc, 出现小数后,就造成了空域的错位,以及到后面的kxk bin,也会出现。所以都是使用双线性差值来解决错位。

  yolact是因为产生的模板,本身就是mask都是空域卷积来的,不存在错位问题。

下图来自 https://blog.****.net/jiaoyangwm/article/details/89176767

yolact问答

  yolact问答

 

 

3.yolact的网络结构是什么样子的?

 分为2个分支, 上面的p3就是c3, P4就是C4,P5是c5, p6 p7是C5进行两次stride=2卷积分别得到的结果

yolact问答

4.yolact的损失函数是什么样子的?

 

5.mask prototype是如何产生的?

   P3卷积后产生channel数为k的层,类似与特征层那样。

6. 系数分支是如何计算系数的?

    所谓系数,模板,都是相对于上面分支,每个anchor产生的box而言的,prediction head,预测很多anchor box, (x,y,w,h, 每类score向量),然后产生这个anchor box对应的mask,的模板系数。 

7.mask的剪切是怎么回事?训练和inference时候,有区别吗?

  生成的模板,尺寸是相对于整个输入图片的,所以小目标,在模板中,响应会是很小的一点,如果用来直接计算损失,那么其损失会很小,而大目标产生的损失就很大,这样的网络对小目标检测效果肯定不好。

   inference时候,就不需要剪切了。