机器学习如何做特征选择实验

不同特征选择算法在不同数据集上的错误率

不同特征选择算法在不同数据集上选出解的数目

迭代次数不同的情况下出现新解的个数

出现新解越少说明算法逐渐收敛,在同一张坐标轴上显示多个算法出现新解的个数可以有效比较算法收敛速度。

所有代中每个特征被选中的频率

如果有些解频率很高,有些解频率很低,说明此算法比较稳定。

下面这张图就显示了每个特征被选中的频率。如果线条越黑,则说明特征被选中的频率越大,如果整张图都是灰色的,那么这个算法其实还有提升的空间。
机器学习如何做特征选择实验

不同参数下的实验结果

不同分类器(SVM, KNN)下的实验结果