【01】 课程介绍 - 计算机视觉概述

1、本课学习内容、学习目标

1.1 课程介绍

  1. 什么是计算机视觉;
    计算机视觉,顾名思义就是针对视觉数据进行研究;
  2. 计算机视觉课程的重性;
  3. 海量的视觉数据(youtube为例);
  4. 介绍讲师,都是李飞飞老师的博士生;
  5. CS231与斯坦福其它课程的关系;
    CS131、CS224n、CS231a、CS231n;

1.2 视觉发展历史

本节讲解的主要内容

  1. 动物视觉的发展历史;
  2. 机器视觉的发展历史,目标分割概念;
  3. 计算机视觉发展历史,课程中提及的论文,Adaboost实时人脸检测;
  4. 两个著名的数据集合——ImageNet、Pascal Voc数据集合(解决过拟合问题);、

学习要点指南

  1. 掌握猫视觉实验的结论;
  2. 掌握目标分割的概念;
  3. 了解Adaboost实时人脸检测算法如何实现;
  4. 了解ImageNet、Pascal Voc数据集合包含的图片种类及类别;

论文推荐

  • “SIFT” & Object Recognition,David Lowe,1999;
  • Spatial Pyramid Matching, Lazebnik, Schmid & Ponce, 2006;
  • Histogram of Gradients(HoG), Dalal & Triggs, 2005;
  • Deformable Part Model, Felzenswalb, McAllester, Ramanan, 2009;

1.3 卷积神经网络的发展

本节讲解的主要内容

  1. 图像任务简介:图像分类、图像检测、Image captioning;
  2. Imagenet大赛中使用的模型
    传统提取特征——SVM;
    神经网络(2012年Alexnet是一个大的突破),趋势是越来越深;
    最早使用CNN的是LeCun用来做手写数字识别
  3. 展望计算机视觉发展的方向(存在的问题)

学习要点指南
突破性事件是2012年的Alexnet;
神经网络迅速发展的两大条件(GPU和数据);
【01】 课程介绍 - 计算机视觉概述

1.4 需要掌握的基础知识

  • HOG:什么是HOG特征,可以用来做什么;
  • SIFT:什么是SIFT特征,可以用来做什么;
  • SPM:什么是空间金字塔匹配,可以用来做什么;