YouTube推荐算法解读
一、YouTube推荐系统总体框架
1.候选集生成(candidate generation):基于用户的观看历史
和观看时长
,及相似用户的浏览记录
;
用户相似度计算(similarity):基于用户观看的视频ID
、搜索关键词
及用户的相关统计信息
;
loglikelihood ratio:计算原理
候选集生成算法
topN 的生成
2.排名过滤(ranking):以用户观看时长构造期望函数,来给候选视频设定分数;
分数的计算通过几百个特征计算得到,特征主要从用户浏览记录
、搜索记录
、视频的观看人数
以及视频新鲜程度
等方面提取
3.注意:
1)算法并不总会受用户所看的上一个视频的影响,即“我们会优先使用用户的随机观看和关键词搜索记录,然后才会考虑上一个观看视频的数据;
2)通过点击率进行排名往往会变相鼓励诱导性的视频内容,用户即便点进去也很少看完视频,因而观看时长能更反映出视频的好坏”;
3)如果用户并未观看最近推荐的视频,页面下一次加载时模型就会自动降低该视频的排名,也不会推荐给相似用户。
相关链接:原文地址