细粒度图像分类笔记(持续更新)
想要写一篇博客来简单记录我的学习轨迹。
先观察一下现在的分类准确率。
上图为Bilinear CNNs 模型的图片分类准确率。我们可以看到准确率已经很高了。而且是一种弱监督模型
2014年的GoogleNet是卷积神经网络的又一个发展。
参考文献:Going deeper with convolutions:
提出了一个代号为Inception的深度卷积神经网络架构,该架构负责在2014年ImageNet大规模视觉识别挑战赛(ILSVRC14)中设置分类和检测的新技术水平。 该体系结构的主要标志是提高了网络内计算资源的利用率。 这是通过精心设计的设计实现的,该设计允许增加网络的深度和宽度,同时保持计算预算不变。 为了优化质量,架构决策基于Hebbian原则和多尺度处理的直觉。 在我们提交的ILSVRC14中使用的一个特定的化身称为GoogLeNet,一个22层深的网络,其质量在分类和检测的背景下进行评估。
物体检测的最大收益并非来自单独使用深度网络或更大的模型,而是来自深层架构和经典计算机视觉的协同作用.