LR在排序上的应用

LR介绍

逻辑回归(logistic regression)是一种广义的线性回归分析模型,最常见的应用是二分类或多分类的分类中,是一种经典的利用对数损失函数的判别式分类算法。
二分类问题的概率与自变量之间的关系图形往往是一个S型曲线,如图所示,采用的Sigmoid函数实现
LR在排序上的应用

排序问题

在进行数据分析中,我们经常会遇到排序模型,如果回想机器学习的内容时会发现,统计机器学习似乎对分类、聚类、回归、标注有很多介绍,但没有单独介绍排序模型,其实排序模型在很多时候都可以利用分类等模型进行简单转化即可。

LR应用在排序问题上

在进行特征分析时,我们经常把特征进行计算统计后作为x即特征,y作为分类结果,在排序时,不在输出y的预测,而是利用离线的y值,得到LR的权重,即为每个特征的重要性,然后利用简单的线性组合得分最后应用到排序上,在实际业务上LR作为排序时,我们经常把LR作为基准模型,后续利用L2R算法进行排序提升。

Spark 上的LR代码应用

我们是利用scala进行的代码开发,scala和java很像,当然还是建议python开发比较快代码也可以平移 mllib.

// An highlighted block
var foo = 'bar';

第一次写,不太会编辑,有问题大家随时指出,我再改