机器学习基石(林轩田)第一章 笔记与感悟总结
第一章学习问题
1.1课程生产
老师观点:从基础学起不要成为机器学习的奴隶。
1.2什么是机器学习
学习是从观察出发,视听嗅觉。
观察 - >学习 - >技能
电脑的观察是资料,然后进行处理变成技能。
什么是技巧?技巧是提高一些性能指标(如预测准确度)
为什么使用机器学习例如图片 - 。树的识别我们要识别树,要写100多条规则,这不现实,我们想要机器自己来学习,自己来总结规则机器透过与环境的互动来提高自己的表现。
授机以鱼不如授机以渔〜
三种关键:
- 可以提高的目标,能够被机器学习。比如正确率等等规则
- 不知道如何写下“这些规则”
- 机器学习需要资料输入
1.3机器学习的应用
食物:资料:推特资料;技能:知道哪一家餐厅好不好
服装:数据:销售数据+客户调查:技能:给顾客推荐时尚衣服
壳体:数据:建筑和能源特征资料;技能:预测这个房子盖好后的耗能,用来给建议
交通:数据:交通资料;技能:无人驾驶
教育:data:在线学生的教学系统; skill:判断学生的掌握程度
娱乐:data:顾客打分数据; skill:预测顾客喜好(推荐系统)
可能的机器学习模型:
我们的喜好可以表示一串特征数字。我们的偏好数字与电影的数字点积,最后的数值就知道喜不喜欢。
1.4学习的组成部分
基本的记号:
输入:x(申请人)
输出:y(发卡/不发卡)
不知道的目标函数(目标函数)f:x-> y
训练实例:以前的资料二元组(xi,yi)的集合
假设:我们通过机器学习得到和函数,我们想要^ h尽可能的与˚F相同 !!!!
如图:
假设集H里包括这很多的假设(工作少两年的发卡;欠债10万的发卡),有好有坏。我们机器学习从set中选择一个最好的!(它觉得最好的那个,并不一定会实际最好)
如图
使用数据来计算逼近目标f的假设g!
总结,机器学习就是学习一个函数克,使其尽可能的与实际的规则˚F相近!!!!
1.5机器学习等领域
与数据挖掘的关系。从数据中找到有用的g。机器学习往往和数据挖掘很像,往往不分彼此。
与人工智能的关系.compute something that shows intelligent behavior机器学习是实现人工智能的方法之一。
与统计的关系。统计是实现机器学习的一种方法。传统的统计很多都能用到机器学习中。