Kaggle泰坦尼克号提升准确率探索

初始的把模型大致搭建起来,步骤包括:特征选择,缺失值处理,归一化与正则化,模型选择。得到的准确率是:

Kaggle泰坦尼克号提升准确率探索
这个准确率排名相当低,8000/10000的水平。现在要想办法,提升准确了。

分析一

在分类错误的类别中,我发现有个特征值下错误率特别高:

这里就是登船地点(S)位置的,错误率很高。

Kaggle泰坦尼克号提升准确率探索
当然,S点本身的比例也很高:

Kaggle泰坦尼克号提升准确率探索Kaggle泰坦尼克号提升准确率探索

Kaggle泰坦尼克号提升准确率探索计算下比例,发现差不多。