机器学习(三)小案例

Python 机器学习

2018年3天快速入门python机器学习【黑马程序员】

(三)小案例

机器学习(三)小案例
根据题的信息,我们显然需要找出消费者和产之间的联系:及 aisle 和 user_id之间的关系
我们的思路如下:
1.合并表,使得我们想要的两个字段出现在一个表中
2.交叉表(crossTab)(交叉表是用于统计分组频率的特殊透视表)
3.降维

首先读取数据

机器学习(三)小案例
机器学习(三)小案例
机器学习(三)小案例
机器学习(三)小案例
机器学习(三)小案例

1.合并

我们观察之后,order_id,aisle_id,product_id分别是外键,可以通过他们将四个表合并
使用merge方法
机器学习(三)小案例

2.交叉表机器学习(三)小案例

我们可以看出,很多的特征基本上都是0,这产生了大量的冗余,所以接下来我们要进行降维的操作

3.降维

这里我们使用了PCA降维
参数0.95表示保留95%的原数据的情况下进行降维
机器学习(三)小案例