机器学习第五课part2(one hot encoding,sklearn.preprocessing.PolynomialFeatures)
one hot encoding
one hot encoding一般使用在离散变量,但变量之间没有关系,比如数据中出现好/一般/不好,和蓝色/绿色/红色时,我就不能把两组变量都编写成1,2,3.这样变量之间会有影响,此时就需要用one hot encoding,但是它带来的麻烦就是变量变多,而且变得稀疏.一般在逻辑回归的时候会用,在决策树的时候就不需要one hot encoding.
sklearn.preprocessing.PolynomialFeatures(对变量进行重新编码)点击打开链接