SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori

教程传送门:
SPSS Modeler18.0数据挖掘软件教程(一):背景及软件简介
SPSS Modeler18.0数据挖掘软件教程(二):数据描述性统计与可视化
SPSS Modeler18.0数据挖掘软件教程(三):逻辑回归分析
SPSS Modeler18.0数据挖掘软件教程(四):分类分析-决策树
SPSS Modeler18.0数据挖掘软件教程(五):分类分析-KNN
SPSS Modeler18.0数据挖掘软件教程(六):聚类分析-K-means

1、数据介绍

本节教程中将利用SPSS Modeler18.0对数据进行关联分析,所用的数据集是自带的购物篮数据集《BASKETS1n》,目标是利用Apriori算法挖掘不同商品之间的关联关系。本教程所涉及的数据集我也整理了一份放在云盘,提取码: ktyb,需要的朋友可以直接下载。《BASKETS1n》 数据结构如下:
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
每条记录代表一个用户的购物篮,T表示购买,F表示没有购买。

2、操作步骤

在SPSS Modeler18.0构建区中构建如下关联关系模型:
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
详细操作步骤如下:
在【源】节点中选择【变量文件】源数据。
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
连接到【字段选项】节点中的【类型】节点,并将每个变量的测量属性设置好,指定每个变量的角色。本例中的将项目的角色设置成任意。

SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
通过过滤器对不需要的字段进行过滤:
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
对于不同项目之间的共现关系大小,可以利用【图形】中的【网络图】进行可视化。
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
在网络图中需要设置作为字段的项目,并购选【仅显示true值标志】,显示共同购买,点击运行,得到如下网络图:
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori

将【建模】中的【Apriori】字段拖入构建区,连接过滤器。在【模型】选项卡中设置好【最低条件支持度】与【最小规则置信度】,并勾选【仅包含标志变量的true值】。
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
点击运行得到模型结果,双击结果查看关联分析结果。
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori
在下来菜单中可以选择不同指标。
SPSS Modeler18.0数据挖掘软件教程(七):关联分析-Apriori

3、小结

本节教程中,主要讲解了利用SPSS Modeler18.0对购物篮数据进行了关联分析,详细阐述了从数据导入到模型参数设置的步骤,并对输出结果进行简要说明。