每天三分钟文章速度:capsule neural networks

背景速览

Capsule Neural Networks (CapsNN) 是Geoffrey Hinton 等人在2017年提出的新型网络架构, 目标是解决传统CNN架构中无法处理的对象空间结构问题。
比方说,想象一幅抽象的脸上随机分布着一个鼻子两只眼睛一张嘴(不是一张正常的人脸),CNN会轻易地把它判别成人脸,因为CNN的池化层会忽略掉鼻子、眼睛和嘴相对于人脸的位置。当照片中的对象旋转变形的时候,CNN可能需要更多的训练素材才有可能正确的区分出来。CapsNN就是为了解决这个问题而存在的。每天三分钟文章速度:capsule neural networks

CapsNN 和 CNN 的对比

CapsNN相对于传统CNN在神经元操作上有所不同。
每天三分钟文章速度:capsule neural networks
具体的操作可参见以下算法:
每天三分钟文章速度:capsule neural networks

损失函数定义

CapsNN采用间隔损失和重构损失的叠加:总体损失 = 间隔损失 + α·重构损失。