今日头条算法原理初步探索

今日头条算法原理初步探索

看完几遍关于头条的算法原理文章后,一直觉得逻辑没有理清楚,可能是因为对这方面研究不深的缘故,以上脑图仅作为逻辑梳理所用。
产品定位
基于数据挖掘的推荐引擎产品(你关心的,即是头条)
产品目的
为用户推荐有价值的、个性化信息,连接人与信息
产品调性
头条的调性真的很难判断,如果说微信的调性是克制,百度是科技(AI),网易云音乐是有温度的音乐社区。那头条呢?很多人会想到low、推荐….。我更喜欢用“欲罢不能”去描述。
推荐系统
移动资讯起家的头条,产品的本质是推荐系统。推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。结合头条产品看就是在什么环境下,把什么内容推送给什么用户
用户特点
推荐系统和搜索系统下的对比:
两者都是用户获取信息的主要方式。
推荐系统下的用户被动接受信息,需求模糊,用户场景可以多样化,因此推荐系统就有很大的场景发挥空间,通过让用户看到喜欢的内容留住用户的时间。
搜索引擎下的用户主动寻找信息,需求明确,用户往往更加注意需求解决的速度和准确度,往往只有前十条信息会被看到,但是用户使用场景切换快,频次高,搜索引擎通过让用户看到准确的内容留住用户的频率。
大部分产品往往两者结合,提高用户体验。
推荐系统的两个质量维度
召回率和精度
召回率:提取并推荐给用户的信息条数/提取出的信息条数(预测用户会喜欢)
精度:提取、推荐给用户并被用户喜欢的信息条数/提取出的信息条数
两者最终都汇聚于“喜欢”
推荐特征
深入到算法逻辑,推荐系统和搜索引擎就极为相似了,首先分成了用户和内容两部分,方式都是为两者打标签。然后进行两者的匹配,具体看脑图。
问题一–如何解决冷启动问题
冷启动分为两类,一是用户冷启动,而是内容冷启动
用户冷启动:
作为第一次进入推荐系统的用户,因为没有在产品上留下行为数据,产品无法做出靠谱的推荐。这时一般需要借助用户的背景资料,或者引导性地让用户选择,或者暂时用热门启动替代个性化推荐来解决,在线推荐系统可以做到在用户产生行为数据后立马更新推荐列表。
内容冷启动:
内容的冷启动,新内容还没有用户行为数据,自然也就没有办法通过协同过滤的方式进行推荐,这时一般会利用内容属性的相关程度来解决。
问题二–算法是否存在情感
近几年被提到的词,大数据、人工智能、机器人…..感觉科技变得越来越冰冷,从产品角度看,一个产品不仅要给用户喜欢的内容,更要给用户感受到温度,这应该是产品很重要的一个价值观。但是包括今日头条在内的推荐系统慢慢暴露出来的一个很大的问题就是产品温度,除了人性(贪嗔痴等等)、用户行为、用户画像等等,对于用户情感的考虑也应该是产品应该注意的问题。个人认为在这方面做的出色的产品有网易云音乐。