机器学习绪论
机器学习绪论
今天开始机器学习理论知识学习,希望能坚持到最后,这里的理论知识是基于 周志华—机器学习 一书 的。
个人认为机器学习其实就是从现有的数据中通过统计、假设检验等手段获得一个模型,然后使用该模型去预测新的数据(未参与训练),也即是从模型中的假设空间中找到符合新数据特征的假设,但可能找到多条假设,因此需要我们给它对某种假设的偏好(归纳偏好),最终找的符合偏好的假设就是我们的预测结果。
通常使用‘奥卡姆剃刀’原则来确定‘正确的’偏好,一般来说,‘奥卡姆剃刀’是说“若有多个假设与观察一致,则选择最简单的那个”。简单来说就是需要的假设最少的解释往往是最接近真相的解释,因为没多一条前提假设的使用性就会下降一分,前提条件越多假设成立的概率就越低(因为满足所有前提都成立的可能性低)。越低(因为满足所有前提都成立的可能性低)。