python 课后习题:项目二数据分析之《冰与火之歌》全五卷人物关系图

其实这种人物关系图网上教程一大堆,我也是照着做的。在这里说一下我出错的地方,以及需要注意的一些东西。

注意:

a. 代码缩进,我照着网上抄,网上的缩进不清楚然后我抄错了都没发现,结果出现了人名出现次数都为1的结果……

b. 字符转码问题,这个一向很麻烦,出现decode error的话建议百度解决。我就出现了这种问题,需要将txt文件另存为,修改编码方式为utf8。 (当然不是所有问题都这么解决的)

c. jieba库的分词功能竟然不能读取外国人名中的分隔符(就是这个“•”),会出现编码错误,直接无法分词。这个问题困扰了我很久。后来没有找到能让jieba读取到分隔符的办法,我心生一计:把所有的“•”都替换成“.”(小数点),于是成功了。

d. 对于数据搜集,我直接下载了冰与火之歌五卷的小说txt版,并且在*上搜集了大部分角色姓名,再自己手动修改一下,就得到了数据。(不得不说,自己手动修改那么多东西真是挺麻烦的……说到底还是我修行不足。大家一定有比我更好的办法。)网上下载下来的小说好几卷是分开的,这里可以用命令提示符将几卷合并到一个txt文档。

e. 对于gephi弹出cannot find java 1.8 or higher的提示(我的gephi是9.0.2)。安装最新版java吧,记得配置好环境变量,cmd输入java和javac都有东西出来才说明成功安装了。如果还是不行,将gephi的配置文件(位置在/etc/gephi.conf)修改一下,手动输入jdk安装地址,这个百度搜索错误提示就有了。

f. gephi只能接受csv文件不能是txt。所以windows用户们要打开excel,将文档内容复制粘贴到表格里,点击列表按照空格(或者逗号)分列,最后另存为csv文件才行。导入两个csv文件后(注意要先导入节点文件,再导入边文件),就大功告成了。

python 课后习题:项目二数据分析之《冰与火之歌》全五卷人物关系图