【01】 课程介绍 - 计算机视觉概述
1、本课学习内容、学习目标
1.1 课程介绍
- 什么是计算机视觉;
计算机视觉,顾名思义就是针对视觉数据进行研究; - 计算机视觉课程的重性;
- 海量的视觉数据(youtube为例);
- 介绍讲师,都是李飞飞老师的博士生;
- CS231与斯坦福其它课程的关系;
CS131、CS224n、CS231a、CS231n;
1.2 视觉发展历史
本节讲解的主要内容:
- 动物视觉的发展历史;
- 机器视觉的发展历史,目标分割概念;
- 计算机视觉发展历史,课程中提及的论文,Adaboost实时人脸检测;
- 两个著名的数据集合——ImageNet、Pascal Voc数据集合(解决过拟合问题);、
学习要点指南:
- 掌握猫视觉实验的结论;
- 掌握目标分割的概念;
- 了解Adaboost实时人脸检测算法如何实现;
- 了解ImageNet、Pascal Voc数据集合包含的图片种类及类别;
论文推荐:
- “SIFT” & Object Recognition,David Lowe,1999;
- Spatial Pyramid Matching, Lazebnik, Schmid & Ponce, 2006;
- Histogram of Gradients(HoG), Dalal & Triggs, 2005;
- Deformable Part Model, Felzenswalb, McAllester, Ramanan, 2009;
1.3 卷积神经网络的发展
本节讲解的主要内容:
- 图像任务简介:图像分类、图像检测、Image captioning;
- Imagenet大赛中使用的模型
传统提取特征——SVM;
神经网络(2012年Alexnet是一个大的突破),趋势是越来越深;
最早使用CNN的是LeCun用来做手写数字识别 - 展望计算机视觉发展的方向(存在的问题)
学习要点指南:
突破性事件是2012年的Alexnet;
神经网络迅速发展的两大条件(GPU和数据);
1.4 需要掌握的基础知识
- HOG:什么是HOG特征,可以用来做什么;
- SIFT:什么是SIFT特征,可以用来做什么;
- SPM:什么是空间金字塔匹配,可以用来做什么;