python——数据预处理函数fit_transform()和transform()的区别

https://*.com/questions/23838056/what-is-the-difference-between-transform-and-fit-transform-in-sklearn

python——数据预处理函数fit_transform()和transform()的区别

fit() :用于从训练数据生成学习模型参数

transform():从fit()方法生成的参数,应用于模型以生成转换数据集。

fit_transform():在同一数据集上组合fit()transform()api

要使数据归一化(使其均值为0和方差为1),使减去平均值,然后将结果除以标准偏差。

python——数据预处理函数fit_transform()和transform()的区别

可以在训练数据集上执行此操作。但是,必须将相同的转换应用于测试集(例如交叉验证),或者在预测之前应用于新获得的示例。但是你必须使用相同的两个参数μ米和σp (值)用于归一化训练集。

因此,每个sklearn的变换fit()只是计算参数(例如μ米和σp在StandardScaler的情况下)并将它们保存为内部对象状态。然后,您可以调用其transform()方法将转换应用于特定的一组示例。

fit_transform()加入这两个步骤,用于训练集x上的参数的初始拟合X,但它也返回一个转换后的x′X′。在内部,它只是先调用fit()然后调用transform()相同的数据。