R语言小实践---云词分析

1、加载本次云词分析使用的包

library(rJava)

library(Rwordseg) #调用的是rJava包里的某个分词函数，所以要先打开ijava包

library(wordcloud2) #做云词

2、本次实践的是对《我不是潘金莲》影评分析，里面涉及到名字，所以需要进行人名识别

segment.options(isNameRecognition = TRUE)

3、可以向词典加入自定义词汇，我比较懒没有加

insertWords()函数

insertWords(c('科斯托格洛托夫','帕维尔','尼古拉耶维奇','鲁诺夫','伊丽莎白','阿纳托利耶夫娜','舒卢宾','艾哈迈占','费得拉乌','董佐娃','瓦季姆','普罗什卡'),save=TRUE)

4、做分词

segmentCN("E:\\R\\mimi6\\1.csv",returnType="tm")

我事先把数据下载下来的

下载链接：https://blog.****.net/lht_okk/article/details/54880614

5、做统计

我没有找到R语言做词频统计的函数，就用的Excel做的

6、做云词

data <- read.csv("E:\\R\\mimi6\\1.segment.csv")

wordcloud2(data[0:1000,]) #数据太多时一定要提取前1000个（N）做分析

常规：wordcloud2(data）

结果：

R语言小实践---云词分析