sql server 创建bayes模型
本文介绍用sql server 创建bayes模型来对上次的数据进行分析,关于数据,请参见博文http://blog.****.net/WQ963369/article/details/79386603。好了话不多说,直接搞起。
首先在"sql server BI"中建立项目,建立数据源,如果不会创建,请参见博文http://blog.****.net/WQ963369/article/details/79395900。建立好之后,如下图所示:
建立数据源,建立完后,如下图所示:
建立数据源视图,与决策树一样,建立两个数据源视图,一个测试数据源视图,一个训练数据源视图,建立完成后,如下图所示:
接下来建立挖掘结构,用bayes模型:
选择数据源,下一步:
指定类型数据,进入下一步:
在"挖掘模型"选项下,设置算法参数,算法参数的解释请看这个网页:https://technet.microsoft.com/zh-cn/library/cc645902(v=sql.105).aspx,本文设置如下:
其主要原因还是因为属性个数(或者说特征数量)比较少的原因。
这步完成后,开始部署模型:
单击“挖掘结构”,进行浏览:
单击“属性配置文件”选项卡,从中可以了解每个描述属性的状态分布情况:
单击“属性特征”选项卡,可以了解到不同的群体的基本特性概率:
单击“属性对比”选项卡,可以了解到不同类别的倾向性:
接下来,进行预测分析,按下列,一步一步操作,如果有困惑,请参看“决策树模型建立"的那篇博文http://blog.****.net/WQ963369/article/details/79395900。
完成之后,在空白处,点击鼠标右键,选择”结果“,之后预测结果如下图所示:
我再把决策树的预测结果拿过来,做个对比,如下图:
可以看到结果相符。当数据量比较大时,我们自然会看到,这两个模型的差异,目前的结果只是因为数据量小,但也能看得出机器学习模型的强大之处。