机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

电影数据分析

准备工作

从网站 grouplens.org/datasets/movielens 下载 MovieLens 1M Dataset 数据。

数据说明

参阅数据介绍文件 README.txt

利用 Pandas 分析电影评分数据

  • 数据读取
  • 数据合并
  • 女生最喜欢的电影排行榜/男生最喜欢的电影排行榜
  • 男女生评分差距最大的电影 -> 某类电影女生喜欢,但男生不喜欢
  • 统计活跃电影 -> 获得评分的次数越多说明电影越活跃
  • 统计电影平均得分
  • 最具争议的电影排行榜 -> 评分的方差最大

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

1.数据读取

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

2.数据合并

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

3.女生最喜欢的电影排行榜/男生最喜欢的电影排行榜

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

4.男女生评分差距最大的电影

-> 某类电影女生喜欢,但男生不喜欢

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

5.统计活跃电影

-> 获得评分的次数越多说明电影越活跃

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

6.统计电影平均得分

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

7.最具争议的电影排行榜

-> 评分的方差最大

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析

机器学习数据科学包(三)——Pandas实例:MovieLens电影数据分析