您的位置: 首页 > 文章 > 论文笔记-MSFM: Multi-scale Fusion Module for Object Detection

论文笔记-MSFM: Multi-scale Fusion Module for Object Detection

分类: 文章 • 2024-01-25 20:01:04

论文阅读计划的第15天

一、研究背景

目标检测要求检测器使用边界框定位图像中的对象，并为每个对象分配正确的类别。目标检测的关键挑战之一是协调解决两个子任务，即定位和分类。定位要求网络准确捕捉对象的位置，而分类则要求网络提取对象的语义信息。

特征融合有利于双重目标检测任务。一方面，当来自浅层和深层的高分辨率和低分辨率特征被融合时，细节和位置信息可以与语义信息相结合。另一方面，可以在不同的尺度上检测对象，提高了框架的健壮性。

二、研究内容

本文提出了一个多尺度融合模块(MSFM)，它从一个单一的输入中提取细节和语义信息，但在同一层不同的尺度。具体来说，模块的输入将被调整到不同的比例，在这些比例上，位置和语义信息将被处理，然后它们将被重新缩放并与模块输入相结合。MSFM是轻量级的，可以用作许多现有对象检测框架的插入层。

三、研究方法

论文笔记-MSFM: Multi-scale Fusion Module for Object Detection
MSFM公式：

每个分支的计算：

多位置的消融实验：

模型参数的优越性：
论文笔记-MSFM: Multi-scale Fusion Module for Object Detection