使用pandas和sklearn对分类特征进行OneHot编码的几种方法
进行OneHot编码常用的几种方法:
首先介绍一下将分类属性数字化的方法。
构造带有分类特征的数据集。
方法一:使用sklearn中的LabelEncoder将分类特征数字化
方法二:使用pandas的factorize()函数将分类特征数字化
下面介绍一下将分类特征进行OneHot编码的几种方法。
方法一:先LabelEncoder,再OneHotEncoder
方法二:先pd.factorize(),再OneHotEncoder
方法三:直接对文本值进行LabelBinarizer
方法四:直接对文本属性进行pd.get_dummies()