分类器

判断飞蛾是月蛾还是帝蛾，这叫分类，做分类的算法叫分类器
虽然可以用照片声音来训练算法，很多算法会减少复杂性，把数据简化成特征，特征是用来帮助分类的值
对于之前飞蛾的例子，我们用了两个特征：翼展和重量
为了训练分类器做出好的预测，我们需要训练数据
专家可以识别飞蛾，所以专家不止记录特征值，还会把种类也写上
机器学习与人工智能
因为只有两个数据

红色标记100个帝蛾，蓝色标记100个月飞蛾，我们可以看到大致分为两组。但中间有部分重叠。

决策边界

所以机器学习算法登场，找出最佳区分
机器学习与人工智能
再加一个条件，重量必须小于0.75，才算帝蛾，这些线叫决策边界

混淆矩阵

仔细看数据，86只帝蛾在正确的区域，剩下14只在错误的区域。另一方面82只月蛾在正确的区域，18个在错误区域。
机器学习与人工智能
这个表记录正确和错误个数，叫混淆矩阵，注意我们没法画出100%正确分类的线。

机器学习的目的是最大化正确分类+最小化错误分类，在中有84%的准确率

未标签数据

用这些决策边界，如果进入森林看到一只不认识的飞蛾，我们可以测量它的特征，并绘制到决策空间上。
机器学习与人工智能
决策边界可以猜测飞蛾种类

决策树

把决策空间切成几个盒子的简单方法，可以用决策树来表示
机器学习与人工智能
生成决策树的机器学习算法

如今有数百种算法，而且新算法不断出现，一些算法那甚至用了多个决策树来预测，计算机科学家叫这个森林，因为有多颗树

支持向量机

机器学习与人工智能

不一定是直线

就像之前，机器学习算法负责，找出最好的线，最准决策边界。
之前两个特征人也能做到，如果再加一个特征触角长度，那么2d线段就会变成3d平面。

真正有用的分类器，会有很多飞蛾种类
机器学习与人工智能

人工神经网络

决策树和向量机这样技术来自统计学。有一大类机器学习爱算法用了统计学，但也有不用统计学的比如人工神经网络。
神经元是细胞
机器学习与人工智能

然后出了信号并发出信号，形成巨大互联网络，能处理复杂的信息。
人造神经元很类似

它不用电信号或化学信号，而是吃数字进去，吐数字出来，它们被改成一层层

回到飞蛾例子，看如何用神经网络分类。
我们第一层输入层，提供需要被分类的单个飞蛾数据，同样也再次用重量和翼展，另一边输出层吗，也有两个神经元：
一个是帝蛾一个是月蛾，两个神经元里最兴奋的就是分类结果，中间有个隐藏层，负责吧输入变输出，负责干分类的重活
机器学习与人工智能
为了看看如何分类，我们放大隐藏层里神经元，神经元第一件事就是把每个输入乘一个权重，假设2.8第一个输入0.1第二个输入

然后对这个结果，用偏差值处理，意思加减一个固定值，比如-6得到3，74。
做神经网络时，这些偏差和权重一开始会设置成随机值。
然后算法调整这些值，来训练神经网络。
使用标价数据来爱训练和测试，逐渐提高准确性。