林轩田机器学习基石--The Learning Problem
林轩田老师的课可以整体分成四个部分。
1.When Can Machines Learn?
2.Why Can Machines Learn?
3.How Can Machines Learn?
4.How Can Machines Learn Better?
下面是第一节课(The Learning Problem)的笔记:
学习:通过阅读、听讲、研究、观察、理解、探索、实验、实践等手段获得知识或技能的过程,是一种使个体可以得到持续变化(知识和技能,方法与过程,情感与价值的改善和升华)的行为方式。
机器学习对应的是:通过数据进行学习找到某种规律或模型,使其具备解决问题的能力。
机器学习看着很厉害,什么情况下能使用机器学习呢?
大致机器学习应满足以下三种情况:
1.问题具有一定的潜在规律。
2.问题很难被普通意义上的编程解决。
3.具有大量的学习数据样本。
机器学习应用的场景:在生活的吃穿住行,方方面面都可以看见机器学习的影子,都有应用。
机器学习的组成部分:
输入 x 输出 y 目标函数 f(最接近实际样本的规律) 训练样本 data
hypothesis:一个机器学习模型可以对应很多个hypothesis
g:通过演算法a得到很多个hypothesis中最好的,最接近f的,g能很好的刻画数据样本的规律
机器算法学习流程图:
其流程:我们事先不知道具体的f,我们也没有办法直接求出来,只能通过已有的数据使用演算法a进行学习,使得找出H中最优的一个,最满足的这些数据规律的为g,很显然g≈f,最终就用这个g替代f,去解决未训练样本的问题。
与机器学习相关的领域:
数据挖掘(Data Mining)人工智能(Artificial Intelligence) 统计(Statistics)
这些领域与机器学习息息相关,没有统一的界限。
总结
大致讲了机器学习的三个使用条件,机器学习的使用流程,以及机器学习相关的领域概念及联系。
注:文章中所有的图片均来自台湾大学林轩田《机器学习基石》课程。