2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

Keras:

有关的介绍:总的来说就是一个深度学习框架

keras - ****博客

https://blog.****.net/xiaomuworld/article/details/52076202

软件工程中的框架:一种可复用的设计构件(从宏观上大体结构的一种规定约束)

软件工程中的框架 扫个盲 嘿嘿 - ****博客
https://blog.****.net/molitiantang/article/details/7868102

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

每一个epoch中会Update很多的参数,因为每一个batch被选择之后就会进行计算Loss Function然后进行参数的更新

SGD的速度比较会,上面的例子就是一个SGD,虽然SGD的方向是不稳定的。

使用Mini-batch的主要原因就是实用性

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

问题:

为什么使用batch size比较大的时候速度回比较快??

答:使用了平行运算,就是同时运算的。

为甚不让batch size 开到很大?、

答:cpu存储,当设置很大的时候实际是表现并不好

解释问题:当有batch的时候GPU是如何平行的加速??

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning

理论上这两中方法运算时间是一样的,但是事实上的运算时间会是第一种的越是第二种的两倍

故而有了GPU,一定要知道使用mini-batch,不然也没有加速

2018-3-21李宏毅机器学习视频笔记(十三)--“Hello Wrold” of Deep learning