Python实现数据分析:数据分析及可视化实战

豆瓣电影数据分析

素材:https://download.csdn.net/download/lm19770429/12503293

Python实现数据分析:数据分析及可视化实战

结巴分词:

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战


Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

"\n".join()也能够实现

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

筛选长度大于1的

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

建立过滤词列表:

 Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

汇总,取高频的前30个词

keywords_counts=keywords_counts.value_counts()[:30]  #统计一下筛选后的关键词情况

 把以上过程设计为一个函数:

 Python实现数据分析:数据分析及可视化实战

 


 Python实现数据分析:数据分析及可视化实战


数据:Python实现数据分析:数据分析及可视化实战

和前面的.db的内容链接起来,找到评分

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

以上可以设计为一个函数

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

调用:

Python实现数据分析:数据分析及可视化实战


Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

 


关键词及评分关系分析:

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

   Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

 

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战


Python实现数据分析:数据分析及可视化实战

Python实现数据分析:数据分析及可视化实战


Python实现数据分析:数据分析及可视化实战Python实现数据分析:数据分析及可视化实战

 

 


import pandas as pd
import sqlite3

def get_movie_id_list(min_comment_count):
    movie_list = comment_data['MOVIEID'].value_counts()
    movie_list=movie_list[movie_list.values>min_comment_count]
    return movie_list.index


conn=sqlite3.connect("douban_comment_data.db")
comment_data=pd.read_sql_query("select * from comment;",conn)
#print(comment_data.head())

#统计每部电影有多少人评论
#movie_list=comment_data['MOVIEID'].value_counts()
#筛选评论数大于100的电影
#movie_list=movie_list[movie_list.values>1000]
#print(len(movie_list))
#print(movie_list.count())
indexs=get_movie_id_list(1000)

print(indexs.tolist())
print(list(indexs))