深度学习开篇简介-图像分类常规模式举例

1.问题描述

现在我们有一组标签:猫 狗  飞机  汽车

输入是一张图

请输出图中内容的标签


2.图像在计算机中的表示

灰度图像用二维数组表示,数值范围是0~255,彩色RGB图像用三维数组表示,最后一维长度为3,(1,2,3分别表示RGB三个分量),对于每一个分量,数值范围也是0~255。红、绿、蓝三个通道的缩略图,都是以灰度显示的,用不同的灰度色阶来表示“ 红,绿,蓝”在图像中的比重。通道中的纯白,代表了该色光在此处为最高亮度,亮度级别是255,0表示亮度最低,255表示亮度最亮。只有三个通道同时有值才可以显示出彩色(如红色通道显示为红色)。

深度学习开篇简介-图像分类常规模式举例


常规套路:

1.收集数据并给定标签

2.训练一个分类器

3.测试,评估


def train(train_images,train_labels):

  #build a model for images -> labels...

 return model

def predict(model,test_images):

  #predict test_labels using the model ...

 return test_labels