一、特征工程

问题:

1、常用的特征工程方式?

答:

引用图形:

一、特征工程

参考:七种常用的特征工程 https://www.cnblogs.com/peizhe123/p/7412364.html 总结的很好

1.对于不同的特征该如何进行特征工程? 
(1)对于数值型特征,采用特征归一化,目的是将所有的特征统一到大致相同的我数值区间 
(2)对于类别型特征,先处理成数值型特征,具体可以采用序号编码(处理类别之间具有大小关系的数据),独热编码(处理类别之间不具有大小关系的数据),二进制编码(维数少于独热编码,节省存储空间) 
(3)对一阶离散特征两两组合,构成高阶特征,目的是提高复杂关系的拟合能力。 
(4)文本特征,采用词袋模型和n-gram模型,主题模型,词嵌入模型

问题:

2、浅层神经网络和深层神经网络的区别?

3、生成模型和另外一种什么模型?

4、迁移学习和生成对抗网络?

5、神经网络的简单描述?

6、降维方法有哪些,和矩阵分解的关系,例如在组合特征中学习的参数维数变多有什么处理方法,?

为什么采用这样的处理方法?

7、什么叫梯度提升决策树?