词云图

#导入库
import pandas as pd
import numpy as np
from wordcloud import WordCloud #词云图的库
import os
import matplotlib.pyplot as plt
from imageio import imread #背景形状自定义使用的库
os.chdir(r’C:\Users\郭小碧加油鸭\Documents\第一周\数据可视化’) #自定义当前目录
#导入数据
with open(‘附件1.csv’) as f:
data=pd.read_csv(f,sep=’,’)
data.head()
词云图数据显示前五行
word=data[‘商品’].value_counts() #统计各个商品的数量频数
#商品频数大显示比较大
back_pic=imread(‘C:/Users/郭小碧加油鸭/Pictures/5ad4be201367398a89bd46f3f5b4216.jpg’)#背景形状,找一张图片做背景形状(这里我用了乔巴的照片)
#color=(’#000000’,’#00FF00’,’#0000FF’,’#FF0000’)

colormap=color.ListedColormap(color)

wc=WordCloud(font_path=‘C:/Windows/Fonts/simhei.ttf’) #字体路径,在当前目录windows的font,注意:要对应字体格式,如:中文的找中文的格式
width=‘500px’, #设置画布宽度,默认400像素
#heigth=‘400px’, #设置画布高度,默认200像素,如果下面设置mask会报错
background_color=‘white’, #背景颜色
max_words=200, #限制文字数量
prefer_horizontal=1, #词语水平方向排版出现的频率,默认 0.9 (所以词语垂直方向排版出现频率为 0.1 )
max_font_size=500, #最大字号
min_font_size=5, #显示的最小的字体大小
font_step=3, #相邻字号步长
stopwords=None, #设置需要屏蔽的词,如果为空,则使用内置的STOPWORDS
scale=10, #按照比例进行放大画布,如设置为1.5,则长和宽都是原来画布的1.5倍。
mask=back_pic) #自定义形状,背景图片的画布一定要设置为白色(#FFFFFF),然后显示的形状为不是白色的其他颜色。
pic=wc.fit_words(word) #词频
plt.imshow(pic) #生成图片
plt.axis(‘off’) #不显示坐标轴
plt.show() #4.显示图片
词云图
词云图