吴恩达DL3.2.9节:什么是端到端的DL?
-
课堂笔记
端到端(end-to-end)学习:传统处理方法的输入和输出中间有很多步骤,而端到端DL是忽略这中间的所有阶段,用单个神经网络去代替它。
例子:语音识别成文字比如人脸识别的门禁系统:
传统人脸识别有两个步骤:
1.标识出照片中的人脸的位置
2.将照片中的人脸和库中的人脸进行对比,判断是否是一个人。
而端到端学习直接把拍到的照片和库中的人脸照片相比较,得出结果。
但是这里存在一个问题:
当分为两步时,每一步都更容易有更多的训练数据,而端到端的话不容易有这么多数据(拍到的照片和照片中人脸的数据),如果有这么多数据,那么端到端也许回避分阶段效果更好。
另外的例子:
机器翻译 和 根据X光图片判断孩子的年龄
- 机器翻译中,因为现在很容易收集很多语音和文字的对应关系的数据集,所以端到端的方法会更好用;
-
X射线诊断中,根据手的X涉嫌判断儿童的年龄,可以为分为两步:
- 从X射线图中将每一块骨骼检测出来;
- 利用骨骼来判断儿童的年龄
这两步的数据都比较容易获得,
而反观端到端学习,直接由X射线图来识别出年龄,这样的数据不容易获取,所以在你没有得到更多这样的数据集之前,分阶段学习可能是更好的选择。
讲到这里我个人感觉当端到端的数据好获取的时候,端到端不仅表现优异,而且能够简化系统架构,此时选择端到端是较为合适的。
下节将讲述何时适合使用端到端学习。