5-05特征选择(特征预处理第一步)

5-05特征选择(特征预处理第一步)

特征选择可以在特征变化之前,也可以在之后,本章是根据统计学模型、机器学习模型进行相关度排序,相关度差的进行删除(最终实现降维度)
5-05特征选择(特征预处理第一步)
特征选择需要重复做,需要模型去验证,最终获得能获得更好模型的数据
5-05特征选择(特征预处理第一步)5-05特征选择(特征预处理第一步)
特征选择三个切入思路,第一个是过滤思想,原理:看特征属性与标注的相关性特征,如果相关性特别小,就去掉这里我们需要复习一张表
5-05特征选择(特征预处理第一步)
第二个是包裹思想,假设所有的特征属性在一个集合里,那么我们就是寻找最优的子集,这种思想比较常用的方法叫做RFE算法
5-05特征选择(特征预处理第一步)
5-05特征选择(特征预处理第一步)
RFE算法具体内容
5-05特征选择(特征预处理第一步)
第三种嵌入思想
5-05特征选择(特征预处理第一步)
5-05特征选择(特征预处理第一步)