战略坐标图制作【未完】
一、软件准备
1.spss
2.书目共现分析系统(BICOMB)——安装
二、数据准备
从CNKI数据库检索主题为“中国”的论文,导出前20篇文献信息,保存为NoteFirst格式。
三、词篇处理(bicomb)
包含主题词抽取、高频词截取和共词矩阵生成。
1.新建项目
在软件界面中,点击右侧的“增加”。然后在中间界面,按照要求输入项目编号(编号只允许使用数字或字母)、格式类型(包含CNKI、PubMed、Wos和万方)和项目说明(非必须)。
- 项目建立完成后,会在Bicomb2的文件目录下产生一个以项目标号(我这里是0923)命名的项目文件夹。该项目文件夹,可以存储后续分析过程中产生的结果文件。
- 在项目建立后,可以将CNKI中获取的Notefirst数据文件直接复制到该项目(这里是0923)文件夹中。——【注意】若为单文档,可以直接放在该文件夹下;若为多文档,可以在该文件夹中再建一个新的子文件夹,来保存多文档数据。
- 选中项目,点击该界面右侧的“删除”按钮可以删除项目。
2.项目字段的提取
点击页面底端的“提取”标签,切换到数据的提取界面(提取界面可以实现对数据的加载、知识单元的提取和批量修改)点击界面右侧的“选择文档",定位项目文件夹(这里是0923)中的txt文件。然后,点击“提取”来得到各个字段的基本抽取结果。
- 提取结束后,可以在关键字段中选择查看作者、期刊名、标题、发表年代、引文等知识单元信息。(该步骤作为初步抽取信息结果,仅仅包含文章号和值两列)
- 若需要使用其他软件配合进行分析,可以点击右侧“导出”功能,将文件保存为txt或xml格式。
- 若要删除某个字段,可以点击“摘除”按钮。例如,文档中存在一些无意义的词汇,可以通过该方式直接删除掉。若字段中存在一些需要修改和更正的信息,可以点击“修改”按钮来实现对关键字段的整体替换和局部替换
3.频次统计
字段信息抽取成功后,点击页面底端的“统计”进入数据的频次分析界面。在该界面“关键字”中选择需要分析的字段(这里以分析关键词为例),点击“统计”。分析结果包含字段的序号、频次、百分比及累计百分比。
- 在该界面,选中某个关键词并右击鼠标,会提示将结果导出至txt或excel。选择后,软件会将所选择关键字段的原始文献信息导出,并自动打开。
- 在软件界面中,可以根据实际的需要来导出词频的分布结果。例如,在“频次阈值"中输入3,然后点击导出至Excel,导出词频大于等于3的关键词词频结果到Excel中。
- 此处【导出文件1“高频词.xlsx”】,按照分析需求,设置频次阀值,导出高频词excel列表(此处阀值设置为3,导出频次大于等于3的关键词词频结果)
文件1“高频词.xlsx“:
4.生成矩阵
提取了关键词词频结果后,点击页面底端的“矩阵”标签,进入矩阵的生成界面。(根据上一步的分析,关键词的词频范围为1-8)参考关键词的词频分布,这里选取所分析的关键词词频范围为3-8。
- bicomb可以生成两种矩阵,词篇矩阵(非对称的0-1矩阵)和共现矩阵(对称矩阵)
- 生成词篇矩阵:点击“生成”以得到词篇矩阵。分析结束后,点击“导出矩阵至txt",将结果保存到txt文档中。此处【得到文件2“词篇矩阵.txt”】
-
生成共现矩阵:在分析得到词篇矩阵的基础上,再依次点击“共现矩阵”、“生成”以得到共词矩阵。得到共词矩阵后,点击“导出矩阵至txt"保存结果。此处【得到文件3“共现矩阵.txt”】
四、聚类分析(spss)
参考
1.战略坐标图制作的操作演示
2.《科学计量与知识网络分析: 方法与实践(第二版)》李杰著