AI_06_多分类、决策树分类、随机森林分类_03_评估指标_K折交叉验证

GridSearchCV  模型选择/验证   CV是CrossValidation(交叉验证)的简称

我们在用数据训练模型的时候,往往会给算法传入超参数(学习率,迭代次数,收敛的值)

AI_06_多分类、决策树分类、随机森林分类_03_评估指标_K折交叉验证

regularization : 正则化

param_grid = {"tol": [1e-4, 1e-3, 1e-2],
              "C": [0.4, 0.6, 0.8]}
log_reg = LogisticRegression(multi_class='ovr', solver='sag')
grid_search = GridSearchCV(log_reg, param_grid=param_grid, cv=3)


log_reg.fit(X, y)  #拟合x数据,容易过拟合

grid_search.fit(X, y)  #把数据分为cv=3份儿,组合超参数param_grid 选择更好的模型,所以训练模型的时长更长!!!

 

AI_06_多分类、决策树分类、随机森林分类_03_评估指标_K折交叉验证

一般3 Grid 或是5 Grid交叉验证就够了!