【推荐系统】电影推荐项目系统设计

系统模块设计

【推荐系统】电影推荐项目系统设计

项目系统架构

【推荐系统】电影推荐项目系统设计

细化

【推荐系统】电影推荐项目系统设计

细化

【推荐系统】电影推荐项目系统设计

数据集

使用的是movieLens数据集,

movies.csv 电影信息

ratings.csv 用户评分信息

tags.csv 用户给电影所打的标签信息

电影信息

 【推荐系统】电影推荐项目系统设计 

用户评分信息

【推荐系统】电影推荐项目系统设计

主要数据模型(对应BI模型?)

【推荐系统】电影推荐项目系统设计

统计推荐模块

【推荐系统】电影推荐项目系统设计

历史热门电影统计

统计所有历史数据中每个电影的评分数(RateMoreMovies)

select mid, count(mid) as count from ratings group by mid

近期热门电影统计

统计每月的电影评分个数,代表了电影近期的热门度(RatingofMonth)

select mid, score, changeDate(timestamp) as yearmonth from ratings

 

select mid, count(mid) as count ,yearmonth from ratingOfMonth group by
yearmonth,mid order by yearmonth desc,count desc

【推荐系统】电影推荐项目系统设计

各类别 Top10 评分电影统计

【推荐系统】电影推荐项目系统设计

 

离线推荐模块

用ALS训练隐语义模型

【推荐系统】电影推荐项目系统设计

 

 

计算用户推荐矩阵(这里又忘记了)

 

计算电影相似度矩阵(again!)