数据分析与挖掘-挖掘建模
经过数据探索与数据的预处理,得到了可以用于建模的数据。更加挖掘目标和数据的形式可以建立分类与预测、聚类分析、关联规则、时序模式和偏差检测等模式。
常见的分类与预测算法:
回归分析:
回归分析是通过建立模型来演技变量之间相互关系的密切程度、结构状态及进行模型预测的一种有效工具。
、
聚类分析:
聚类分析实在没有给定划分类别的情况下,根据数据相似度进行样本分组的一种方法,聚类模型可以建立在无类标记的数据上,是一种非监督的学习算法。
常见的聚类方法:
关联规则:
目的是在一个数据集中找出各项之间的关联关系,而这种关系并没有在数据中直接表示出来。
常见的关联规则算法:
时间序列算法:
离群点检测
参考:Python 数据分析和挖掘实战