自编码器(autoencoder)在协同过滤中的应用
摘要
本文简单介绍一下论文<A Hybrid Collaborative Filtering Model with Deep Structure>中的一些idea。具体详细的论文分析可以参考我上传在CSND的论文ppt讲解。
1.自编码器(autoencoder)
网上有许多关于自编码器的文章,以下这篇来自知乎的文章我感觉作为自编码器的入门是一个很好的帮助。
https://www.zhihu.com/question/41490383。
2.在协同过滤中利用自编码器
在之前的文章中,我们知道model-based CF中关键是找到latent factor ,而latent factor一般可以利用矩阵分解(matrix factorization)。而我们通常情况下得到的user-item矩阵是非常稀疏的。而在这种情况下(user-item矩阵非常稀疏)我们得到的latent
factor并不是很有效的表达。那么有没有更佳的方法获得更有效的latent factor 呢?自Hinton 2006年的工作后,有许多利用deep learning的方法获取Latent factor。
一般而言,当自编码器网络中有
层时,第
层则为编码输出。在协同过滤中,可把第
中的编码输出作为latent factor 。具体来说,当
时,网络结构如下图所示。