深度学习开篇简介-图像分类常规模式举例
1.问题描述
现在我们有一组标签:猫 狗 飞机 汽车
输入是一张图
请输出图中内容的标签
2.图像在计算机中的表示
灰度图像用二维数组表示,数值范围是0~255,彩色RGB图像用三维数组表示,最后一维长度为3,(1,2,3分别表示RGB三个分量),对于每一个分量,数值范围也是0~255。红、绿、蓝三个通道的缩略图,都是以灰度显示的,用不同的灰度色阶来表示“ 红,绿,蓝”在图像中的比重。通道中的纯白,代表了该色光在此处为最高亮度,亮度级别是255,0表示亮度最低,255表示亮度最亮。只有三个通道同时有值才可以显示出彩色(如红色通道显示为红色)。
常规套路:
1.收集数据并给定标签
2.训练一个分类器
3.测试,评估
def train(train_images,train_labels):
#build a model for images -> labels...
return model
def predict(model,test_images):
#predict test_labels using the model ...
return test_labels