NO.86——数据挖掘 泰坦尼克号获救分析
文章目录
数据挖掘流程
(一)数据读取
-
读取数据,并进行展示
-
统计数据各项指标
-
明确数据规模与要完成的任务
(二)特征理解分析 -
单特征分析,逐个变量分析其对结果的影响
-
多变量统计分析,综合考虑多种情况影响
-
统计绘图得出结论
(三)数据清洗与预处理 -
对缺失值进行填充
-
特征标准化/归一化
-
筛选有价值的特征
-
分析特征之间的相关性
(四)建立模型 -
特征数据与标签准备
-
数据集切分
-
多种建模算法对比
-
集成策略等方案改进
详情参考我的Github地址