【大数据技术与推荐系统(3)】推荐系统设计
推荐系统设计
- 需求分析和用户调研
-
用户:
新用户->兴趣未知,着重促销、多样性、新颖性
老用户->兴趣已知,着重个性化
主流用户,小众群体? -
推荐什么:
价格一致,用户经常购买的类别
书、电影、音乐、文章->以用户对内容主题的兴趣为主
价格不一致,用户经常购买的类别
服饰、日用百货->视觉、品牌、价格、内容
用户很少购买的类别
房、车、装修材料、家具->专家推荐、互补推荐
新品促销/库存清理->考虑整体系统的获利 -
何时:
Email VS 手机短信
短期、长期、周期(节假日) -
何地:
基于位置的服务
- 功能设计
-
个性化首页
个性化促销,关注信息推送 -
Item页面
关联商品
基于浏览历史的推荐
基于购买历史的推荐 -
User页面
-
购物车页面
-
Community页面
-
其他:手机、email
- 界面设计
-
如何将推荐结果呈现给用户?
-
如何收集用户信息和反馈数据?
-
目的:
提高用户满意度,达到推荐目的
更多更好地收集高质量的用户反馈
准确评测推荐算法效果
- 架构设计
-
硬件资源限制
-
用户数、item数
-
存储、接口
-
实时响应的要求
- 算法设计
- 优化准则
- 数据预处理
- 离线算法
- 在线算法
- 功能实现策略
- 推荐解释
- 系统评测
- 用户反馈
点击率?转换率?单次使用时长?重复使用率? - A/B测试
用户界面重要性
- 呈现方式不同会导致推荐反馈不一致
- 界面不同可能导致优化目标不同(推荐数目)
- 用户反馈数据是算法的基础—不仅要吸引用户提供反馈,还要提供准确的反馈机制(引导词)
- 好的设计可以弥补差的推荐,提升用户体验以及用户数据质量
- 可以用界面解决某些算法问题,如流行和长尾的平衡
- 新的呈现方式会对算法提出新的要求
最根本:客观评测VS.主观评测
机器学习算法——客观评测
推荐系统——主观评测
即,给不同人推荐同样item反馈不同
用户数据采集的重要性
数据充足,简单算法性能可以很好
数据缺失,任何算法都不可能有好的性能
某些情况下用户不愿意提供反馈
但是,如果用户愿意提供反馈,而网站没有给用户反馈的机会……
用户愿意表达自己的偏好
好的算法要有好的呈现