您的位置: 首页 > 文章 > 【01】课程介绍 - 计算机视觉概述

【01】课程介绍 - 计算机视觉概述

分类: 文章 • 2024-01-01 14:50:40

1、本课学习内容、学习目标

1.1 课程介绍

什么是计算机视觉；
计算机视觉，顾名思义就是针对视觉数据进行研究；
计算机视觉课程的重性；
海量的视觉数据（youtube为例）；
介绍讲师，都是李飞飞老师的博士生；
CS231与斯坦福其它课程的关系；
CS131、CS224n、CS231a、CS231n；

1.2 视觉发展历史

本节讲解的主要内容：

动物视觉的发展历史；
机器视觉的发展历史，目标分割概念；
计算机视觉发展历史，课程中提及的论文，Adaboost实时人脸检测；
两个著名的数据集合——ImageNet、Pascal Voc数据集合（解决过拟合问题）；、

学习要点指南：

掌握猫视觉实验的结论；
掌握目标分割的概念；
了解Adaboost实时人脸检测算法如何实现；
了解ImageNet、Pascal Voc数据集合包含的图片种类及类别；

论文推荐：

“SIFT” & Object Recognition,David Lowe,1999;
Spatial Pyramid Matching, Lazebnik, Schmid & Ponce, 2006;
Histogram of Gradients(HoG), Dalal & Triggs, 2005;
Deformable Part Model, Felzenswalb, McAllester, Ramanan, 2009;

1.3 卷积神经网络的发展

本节讲解的主要内容：

图像任务简介：图像分类、图像检测、Image captioning；
Imagenet大赛中使用的模型
传统提取特征——SVM；
神经网络（2012年Alexnet是一个大的突破），趋势是越来越深；
最早使用CNN的是LeCun用来做手写数字识别
展望计算机视觉发展的方向（存在的问题）

学习要点指南：
突破性事件是2012年的Alexnet；
神经网络迅速发展的两大条件（GPU和数据）；
【01】课程介绍 - 计算机视觉概述

1.4 需要掌握的基础知识

HOG：什么是HOG特征，可以用来做什么；
SIFT：什么是SIFT特征，可以用来做什么；
SPM：什么是空间金字塔匹配，可以用来做什么；