机器学习算法

机器学习，利用历史数据训练得到模型。
华为云HCIA-AI学习记录002-机器学习概览
使用样本训练、决策的规则复杂或难以描述、由机器自动学习规则

理性认识

目标函数f未知，学习算法无法得到一个完整的函数f。
假设函数g逼近函数f，但可能和函数f不同。

解决的主要问题

最典型的三种任务
分类、回归、聚类。
分类和回归是预测问题的两种主要类型，占到80%~90%，分类的输出是离散型的类别值，而回归的输出是连续数值。

机器学习分类

监督学习

利用已知类别的样本，训练学习得到一个最优模型，使其达到所要求性能，再利用这个训练所得模型，将所有的输入映射为相应的输出，对输出进行简单的判断，从而实现分类的目的，即可以对未知数据进行分类。
监督学习-回归问题
回归：反映了样本数据集中样本的属性值的特性，通过函数表达样本映射的关系来发现属性值之间的依赖关系。
例如：下周股票能给我带来多少收益？周二的温度会是多少摄氏度？
回归问题重点是去拟合你样本点之间的一个趋势。
监督学习-分类问题
分类：分类问题属于有监督学习，通过分类模型，将样本数据集中的样本映射到某个给定的类别中。
例如：明天早高峰时间段XX路上会堵车吗？（会/不会）哪种手段更吸引顾客：5折还骨折。

无监督学习

对于没有标记的样本，学习算法直接对输入数据集进行建模，例如聚类，即“物以类聚，人以群分”。我们只需要把相似度高的东西放在一起，对于新来的样本，计算相似度后，按照相似度进行归类即可。
无监督学习是基于数据内在相似度去进行的一个分类。
很多时候用户画像都是由无监督学习来完成的。
因为很多时候，我们并不能把所有的类别区分出来，这时候无监督学习的一个价值是可以帮助我们发现我们数据的内在价值。
无监督学习-聚类问题
聚类：通过聚类模型，将样本数据集中的样本分为几个类别，属于同一类别的样本相似性比较大
例如：哪些观众喜欢看同一题材的电影？这些零部件中哪些破损的方式是相似的？
常见算法K-meams

半监督学习

试图让学习器自动地对大量未标记数据进行利用以辅助少量有标记数据进行学习。
可以做回归、分类、聚类。
例如，我们用半监督学习做一个分类，首先用有标签的数据训练一个模型，再用无标签的数据放入到模型当中，看看给出一个伪分类效果，那么我们会选择好的这些数据来继续优化我们的数据及进一步去优化我们最终要得到的模型。就是用没有标签的数据来辅助我们有标签的数据，这是一个分类任务。
同时我们又可以用有标签的数据去辅助我们没有标签的数据，例如半监督的Kmeas聚类，我们将一开始质心点，放在有标签的质心上。

强化学习

学习系统从环境到行为映射的学习，以使奖励信号（强化信号）函数值最大，强化学习不同于连接主义学习中的监督学习，主要表现在教师信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作为一种评价（通常为标量信号），而不是告诉强化学习系统如何去产生正确的动作。
是未来发展非常关键的一步。
模型感知环境，做出行动，根据状态与奖惩做出调整和选择。
关键问题：最佳行为问题
强化学习总是在寻找怎么样的行为才是最佳的？强化学习针对的对象是机器或机器人
例如：自动驾驶汽车：黄灯开始闪了，是刹车还是加速通过？对于一个吸尘机器人，是继续吸尘还是回去充电。
是一个整体的去寻找最佳行为的这样的过程。
对于算法来说，强化学习的模型算法它的目的就是为了更好地完成我们的学习任务，去寻找完成学习任务的最佳行为。

华为云HCIA-AI学习记录002-机器学习概览