Python算法练习(一)// 模型:KNN,数据集:breast_cancer
一、导入库
二、实例化并认识数据
可见:特征数据量纲差异大
三、数据预处理:归一化
四、算法模型初探
五、参数调优,寻找最佳K值
①学习曲线
验证集,归一化,最佳k值=12
②学习曲线与交叉验证组合
验证集,归一化,最佳k值=6
全部样本集,未归一化,最佳k值=12
全部样本集,归一化,最佳k值=8
一、导入库
二、实例化并认识数据
可见:特征数据量纲差异大
三、数据预处理:归一化
四、算法模型初探
五、参数调优,寻找最佳K值
①学习曲线
验证集,归一化,最佳k值=12
②学习曲线与交叉验证组合
验证集,归一化,最佳k值=6
全部样本集,未归一化,最佳k值=12
全部样本集,归一化,最佳k值=8