python 简单词云制作
半原创^_^
学习了一篇关于python实现词云的文章,现在分享给大家
我的制作图如下:
准备工作
python版本:python3.6,2.7均可
操作系统:Ubuntu(自带python 2和3) MacOS(自带python 2和3) Windows (需下载python 2.7 或 3.6)
需要用到模块及工具:
anaconda套餐 (anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。[1] 因为包含了大量的科学包,Anaconda 的下载文件比较大)在官网上选择合适版本下载 ‘xxxx.sh’文件,在终端下使用sudo chmod +x xxxx.sh添加运行权限,然后./xxxx.sh运行安装
jupyter notebook (Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown)Ubuntu用户使用
sudo pip install jupyter 安装
在终端里,macOS或者Linux用户请键入以下命令:
pip install wordcloud
开始利用数据分析
词云分析的是文本信息,我挑选了英剧"Yes, minister",到维基百科上找到了这部剧的介绍词条
复制了介绍部分的内容,存为yes-minister.txt
代码实现
在终端内执行,jupyter notebook
会自动打开浏览器,显示如下界面
点击右侧New,选择python版本2或3
填写新建Notebook文件名,可以任意填写,我选择的是wordcloud
然后就出现了一个空白的笔记本,供我们使用了。我们在网页里唯一的代码文本框里,输入以下3条语句。请务必逐字根据示例代码输入,空格数量都不可以有差别。尤其注意第三行,用4个空格,或者1个Tab开始。输入后,按Shift+Enter键,就可以执行了。
以上程序打开了你的yes-minister.txt文本文件,把里面的内容都读了出来,存储到了一个叫做mytext的变量里面filename = "yes-minister.txt"
with open(filename) as f:
mytext = f.read()
若想读取mytext文件里的内容
在代码文本框内输入
mytext
然后我们使用import导入包,
利用mytext中存储的文本内容来制造词云。
大功告成!我也终于写完了,,,,from wordcloud import WordCloud
wordcloud = WordCloud().generate(mytext)
输出词云图像使用以下语句
%pylab inline#在notebook内显示图像
import matplotlib.pyplot as plt
plt.imshow(wordcloud, interpolation='bilinear')
plt.axis("off")
最后可以尝试wordcloud的高级功能,将词云做的高大上