【推荐系统】电影推荐项目系统设计
系统模块设计
项目系统架构
细化
细化
数据集
使用的是movieLens数据集,
movies.csv 电影信息
ratings.csv 用户评分信息
tags.csv 用户给电影所打的标签信息
电影信息
用户评分信息
主要数据模型(对应BI模型?)
统计推荐模块
历史热门电影统计
统计所有历史数据中每个电影的评分数(RateMoreMovies)
select mid, count(mid) as count from ratings group by mid
近期热门电影统计
统计每月的电影评分个数,代表了电影近期的热门度(RatingofMonth)
select mid, score, changeDate(timestamp) as yearmonth from ratings
select mid, count(mid) as count ,yearmonth from ratingOfMonth group by
yearmonth,mid order by yearmonth desc,count desc
各类别 Top10 评分电影统计
离线推荐模块
用ALS训练隐语义模型
计算用户推荐矩阵(这里又忘记了)
计算电影相似度矩阵(again!)