[源码和文档分享]python数据分析(4)——数据预处理(上)
数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。
1 数据清洗
数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。
参考文档和完整的文档和源码下载地址:
https://www.write-bug.com/article/1935.html
数据预处理的主要内容包括数据清洗、数据集成、数据变换和数据规约。
数据清洗主要是删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值、异常值。
参考文档和完整的文档和源码下载地址:
https://www.write-bug.com/article/1935.html