机器学习与人工智能


机器学习算法让计算机从数据中学习,然后自行做出预测和决定。
虽然AI和ML经常混着用,大多数计算机科学家会说机器学习是为了实现人工智能这个更宏大目标的技术之一。

分类器

判断飞蛾是月蛾还是帝蛾,这叫分类,做分类的算法叫分类器
虽然可以用照片声音来训练算法,很多算法会减少复杂性,把数据简化成特征,特征是用来帮助分类的值
对于之前飞蛾的例子,我们用了两个特征:翼展和重量
为了训练分类器做出好的预测,我们需要训练数据
专家可以识别飞蛾,所以专家不止记录特征值,还会把种类也写上
机器学习与人工智能
因为只有两个数据
机器学习与人工智能
红色标记100个帝蛾,蓝色标记100个月飞蛾,我们可以看到大致分为两组。但中间有部分重叠。
机器学习与人工智能

决策边界

所以机器学习算法登场,找出最佳区分
机器学习与人工智能
再加一个条件,重量必须小于0.75,才算帝蛾,这些线叫决策边界
机器学习与人工智能

混淆矩阵

仔细看数据,86只帝蛾在正确的区域,剩下14只在错误的区域。另一方面82只月蛾在正确的区域,18个在错误区域。
机器学习与人工智能
这个表记录正确和错误个数,叫混淆矩阵,注意我们没法画出100%正确分类的线。
机器学习与人工智能
机器学习的目的是最大化正确分类+最小化错误分类,在中有84%的准确率

未标签数据

用这些决策边界,如果进入森林看到一只不认识的飞蛾,我们可以测量它的特征,并绘制到决策空间上。
机器学习与人工智能
决策边界可以猜测飞蛾种类
机器学习与人工智能

决策树

把决策空间切成几个盒子的简单方法,可以用决策树来表示
机器学习与人工智能
生成决策树的机器学习算法
机器学习与人工智能
如今有数百种算法,而且新算法不断出现,一些算法那甚至用了多个决策树来预测,计算机科学家叫这个森林,因为有多颗树

支持向量机

机器学习与人工智能
机器学习与人工智能
不一定是直线
机器学习与人工智能
就像之前,机器学习算法负责,找出最好的线,最准决策边界。
之前两个特征人也能做到,如果再加一个特征触角长度,那么2d线段就会变成3d平面。
机器学习与人工智能
机器学习与人工智能
真正有用的分类器,会有很多飞蛾种类
机器学习与人工智能

人工神经网络

决策树和向量机这样技术来自统计学。有一大类机器学习爱算法用了统计学,但也有不用统计学的比如人工神经网络。
神经元是细胞
机器学习与人工智能
机器学习与人工智能
然后出了信号并发出信号,形成巨大互联网络,能处理复杂的信息。
人造神经元很类似
机器学习与人工智能
它不用电信号或化学信号,而是吃数字进去,吐数字出来,它们被改成一层层
机器学习与人工智能
回到飞蛾例子,看如何用神经网络分类。
我们第一层输入层,提供需要被分类的单个飞蛾数据,同样也再次用重量和翼展,另一边输出层吗,也有两个神经元:
一个是帝蛾一个是月蛾,两个神经元里最兴奋的就是分类结果,中间有个隐藏层,负责吧输入变输出,负责干分类的重活
机器学习与人工智能
为了看看如何分类,我们放大隐藏层里神经元,神经元第一件事就是把每个输入乘一个权重,假设2.8第一个输入0.1第二个输入
机器学习与人工智能
然后对这个结果,用偏差值处理,意思加减一个固定值,比如-6得到3,74。
做神经网络时,这些偏差和权重一开始会设置成随机值。
然后算法调整这些值,来训练神经网络。
使用标价数据来爱训练和测试,逐渐提高准确性。

传递函数

最后神经元**函数,也叫传递函数,会应用于输出,对结果执行最后一次数学修改。
例如把值限制在-1到1之间,或把负数改为0。
我们用线性传递i,不会改变值,所以3.74还是3.74。
机器学习与人工智能数字最高就是结果
有可能有很多层。
机器学习与人工智能

弱AI 强AI

只能做特定任务叫弱AI,但这并不意味着它没用,真正通用,像人一样的AI叫强AI

强化学习

强化学习和人类学习方式很类似
机器学习与人工智能
计算机通过反复试错来学习,对于很多狭窄问题,强化学习已经被广泛使用,有趣的是如果这类技术可以广泛的应用·,可以创造出像人类小孩一样学习,但学习速度超快。