上吴恩达的机器学习第一周
机器学习定义
Tom Mitchell(1998):
一个程序被认为能从经验E中学习,解决任务 T,达到 性能度量值P,当且仅当,有了经验E后,经过P评判, 程序在处理 T 时的性能有所提升。
监督学习
定义:
监督学习,意指给出一个算法, 需要部分数据集已经有正确答案。
包括:
1. 分类问题:预测一个离散值输出
2. 回归问题:预测一个连续值的输出
两个例子:
房价预测、癌症诊断
非监督学习
定义:
训练样本不含有标记(label)信息,既没有类别信息,也不会给定目标值。(没有属性或标签,不知道正确的答案)
聚类算法
典型例子鸡尾酒会问题(声音的分离)、新闻聚类、基因应用、社交网络的分析、市场分割 的应用
线性回归的算法
假设函数:
代价函数:
梯度下降法(凸函数)
将代价函数 J 最小化,其中 ∂ 代表学习速率, 用于控制每一步移到的大小(梯度用于控制移动的方向)
:
学习速率 ∂:(1)太小,下降速度太慢
(2)太大,会错过局部最小点,甚至无法收敛
线性回归模型: