机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析
电影数据分析
准备工作
从网站 grouplens.org/datasets/movielens 下载 MovieLens 1M Dataset 数据。
数据说明
参阅数据介绍文件 README.txt
利用 Pandas 分析电影评分数据
- 数据读取
- 数据合并
- 女生最喜欢的电影排行榜/男生最喜欢的电影排行榜
- 男女生评分差距最大的电影 -> 某类电影女生喜欢,但男生不喜欢
- 统计活跃电影 -> 获得评分的次数越多说明电影越活跃
- 统计电影平均得分
- 最具争议的电影排行榜 -> 评分的方差最大
1.数据读取
2.数据合并
3.女生最喜欢的电影排行榜/男生最喜欢的电影排行榜
4.男女生评分差距最大的电影
-> 某类电影女生喜欢,但男生不喜欢
5.统计活跃电影
-> 获得评分的次数越多说明电影越活跃
6.统计电影平均得分
7.最具争议的电影排行榜
-> 评分的方差最大