推荐系统【Coursera 斯坦福机器学习】

本文基于Coursera 斯坦福吴恩达机器学习课程

谢绝任何不标记出处的转载

如有问题请联系作者

1. 问题阐述

推荐系统是机器学习中一个非常非常广泛的应用。它的本质是一个补缺问题。

举个栗子，如下图所示，最左边给出了七首歌，第一行为四个用户，我们需要通过用户已经打分出的歌曲，来推断其未打分的歌曲，以此来做推荐。

推荐系统【Coursera 斯坦福机器学习】

这里有几个变量声明：

推荐系统【Coursera 斯坦福机器学习】

举个栗子，r(1,3)即为《王妃2.0》被谢广坤打分的情况，可以看到谢广坤打了1分，所以r(1,3)=1, y(1,3) = 1。

2. 推荐系统方法之content based recommender systems

content based, 顾名思义就是基于内容进行的推荐。

依旧拿上面的歌曲打分举例。如下图所示，我们纳入了四个变量x1, x2, x3, x4，每个变量的值为0-1。通过将每首歌曲用这四个变量衡量，我们得到了七组X向量（我随便赋值的，不太合理）。

例如《王妃》为x(2) = [1 0.99 0 0 0]^T（x0 =1）. 对于每一个用户，我们将其变为长度为5的向量θ。例如王二狗，就有θ（2）=[θ（0,2） θ（1,2）θ（2,2）θ（3,2）θ（4,2）θ（5,2)]=[1 0 5 0 1](随便写的，大概意思就是非常喜欢影视音乐，很不喜欢流行音乐和二次元，有点喜欢女声)。

如果我们想要预测王二狗对于《王妃2.0》的看法，则使用θ（2）^T*X（2）=1，则预测王二狗会给《王妃》打1分（《王妃》属于流行音乐吧，所以基本还是靠谱的）。可以看到，最后预测时用的是一个简单的线性模型。

推荐系统【Coursera 斯坦福机器学习】