网易云图(小白向)(一)
第一篇我来为大家作一个思路上的梳理
一、项目需求
大家的生活都离不开音乐,而说到最走情怀的音乐平台那非网易云莫属,尤其在这“人均网抑”的时代,网易云的评论区俨然成为了大家发泄情绪的一个窗口,就像这首最近又火起来的《信仰》一样
下面的评论可谓是巨巨扎心
在评论中,最上面的是热门评论,我想知道每个歌手评论中出现最频繁的词汇是什么,那么我们便可制作一个云图,如下图所示
从这些词汇中,我们可以迅速了解评价的大概内容,留下一个初步的印象。
二、功能描述
1、抓取歌单
采用爬虫加数据分析的方式,抓取指定歌手的热门歌单。
2、抓取评论
抓取每一个首歌的热门评论。
3、分词
我将热门评论记录内容,对评论用工具进行分词,然后按照词汇出现的频率,频率越高字体越大,呈现词云效果,效果如下:
三、技术方案
我们把上面的需求梳理,整合成项目技术方案,如下列表所示:
- 自动查询某个歌手的所有热门歌曲
- 自动获取每一首歌的基础信息,专辑信息
- 自动获取每一首歌的热门评论,最新评论
- 对所有热门评论进行统计形成词云