(Few-shot detection)Review: Few-shot Object Detection via Feature Reweighting

对于few-shot分类而言，可以采用学习prototype的方式学习一个中心，但是如果用于目标检测，很难匹配和定位一个物体。因为在图像中会有很多的干扰因素和非目标物体。

Feature Extractor module

Feature Extractor从 query images中提取meta features ，表示为 $F \in R^{w*h*m}$

文章中的的Extractor是采用YOLO v2的darknet, 用 $D(I)$ 表示；
Reweighting Module d从support set中提取全局信息并embeded成reweighting coefficient，表示为 $\omega (i) \in R^m$ ；

文章中reweighting是简单的几层网络层，用 $M(I_i,M_i)$ 表示，下图右下角 $I_i$ 表示图像， $M_i$ 表示mask；
Prediction Module

跟YOLO v2相似，预测的值增加one-versus-all classification score $c_i$ 表示对应目标属于类别i的概率；

总共预测六个值： $\{o_i,x_i,y_i,h_i,w_i,c_i\} = p(F_i) i= 1,...,N$ ;

模型其实是做一种Transfer Learning的思想，与原来detection不同的是，训练方式不同，数据组成的方式不同。

数据分为base classes和novel classes，对于每一个task或者episode，包含Support sets和Query sets两部分，

(Few-shot detection)Review: Few-shot Object Detection via Feature Reweighting

网络模型和损失函数上述2.提出方案所示；

整个学习过程分为两个阶段：

base training phase

在此阶段，仍采用base classes进行episode的方式训练，目的是让模型学会通过reweighting vector找到感兴趣的区域；
few-shot fine-tuning

在此阶段，训练数据包括base classes和novel classes，对于novel classes来说，只有k个标注的bounding boxes，对于base classes的数据，也有k个bounding boxes，训练过程和第一阶段相同。support images和boundingbox的数据从base classes和novel classes的数据中随机选取，进行fine-tune；