牛客网机器学习刷题错题集合1
一、有关机器学习分类算法的Precision和Recall,以下定义中正确的是(假定tp = true positive正, tn = true negative负, fp = false positive, fn = false negative)
本题分类问题,同等于检索问题(精确度==查准率,召回率==查全率)。
1、精确度对应预测正确的占预测情况中正类(真正类+假正类)的比例;(所有"正确被检索的样本(TP)"占所有"实际被检索到的样本(TP+FP)"的比例。)
2、召回率对应预测正确的占真实情况正类(真正类+假负类)的比例。(所有"正确被检索的样本(TP)"占所有"应该检索到的正确样本(TP+FN)"的比例。)
二、(不定项选择题) 以下关于正则化的描述正确的是()
正则化可以防止过拟合、L1正则化能得到稀疏解、L2正则化约束了解空间、Dropout也是一种正则化方法。
三、在机器学习中需要划分数据集,常用的划分测试集和训练集的划分方法有哪些( )
留出法法、交叉验证法、自助法(自助抽样法)
四、隐马尔可夫模型三个基本问题以及相应的算法说法正确的是( )
评估-前向后向算法、解码-维特比算法、学习-Baum-Welch算法
五、哪些模型是 分类模型
KNN、Kmeans、Logistic Regression(答案是不是有点问题)
六、影响K-均值算法的主要因素
样本输入顺序、模型相似度测试、初试类中心的选择
七、下面关于贝叶斯分类器描述错误的是( )
以贝叶斯定理为基础、是基于先验概率,推导出后验概率、可以解决有监督学习的问题、可以用极大似然估计解决贝叶斯分类器