SVD在神经网络中的常用应用以及原理

SVD常用矩阵分解:A(m*n) = U(m*n)A(n*m)V(m*n), 在PCA中可以看到，SVD做矩阵压缩，假设压缩至K纬，只需要保留特征值最大的top即可，

那么有:A(m*n) ～ U(m*k)A(k*k)V(k*n) = U(m*k)V(k*n)

SVD在神经网络中的常用应用以及原理

总结：可以看出模型的参数大大压缩而且效果基本上一样。

训练过程注意事项：