人话人工智能(3):小姐姐与损失函数

相信大家对“小姐姐”这个词都不陌生。

人话人工智能(3):小姐姐与损失函数

好的。

那么我们来说说损失函数。

要说损失函数,首先得说监督学习。

要说监督学习,必须得说机器学习。

要说机器学习,它分为四大类,其中有一类就监督学习。

简单地说,监督学习就是,给你一笸箩食物,左半边有苹果、橘子、馒头、包子、鱼香肉丝还有老醋花生。右半边是死涩酸柿子,咖啡煎松花蛋,苦瓜炖榴莲。你全部吃了之后,人生得到了升华,知道了世间百味,有了分辨能力。它给你提供标记好了的样本,让你涨涨记性,并学会举一反三。

咦?他是怎么学会举一反三的呢?

这就用到了损失函数!

起初,很多人学习人工智能的时候,看到损失函数就放弃了。

主要原因是,很多人奔着发财的目的来学习,书上却不断地教你损失,体验很不好!

非也,非也。

损失函数其实就是描述你到底错到什么程度!

举个例子,给你一个张房祖名的照片,你说这是张默,那么经过损失函数一算,给你打分15分,错的不算很严重,因为两个人很像。你要是说照片是迪丽热巴,那么给你打分100分,错的很严重了。

有什么用?我就问问你,这有什么用?

主要是为了改正自己。

《左传·宣公二年》中说:知错能改,善莫大焉!

在预测方面,损失函数可以帮助你做出调整,从而接近正确。

想着你给媳妇挠痒痒,媳妇说后背痒痒,你把手放在腰上挠,媳妇说太低了,你抬手到脖子,媳妇说太高了,你把手移到肩膀,媳妇说还是太高,你把手移到屁股,媳妇说你耍流氓。

这样说来,损失函数就像是媳妇说的话。

有没有用?我就问问你,这有没有用?!

监督学习有两大种类,一类是分类问题,一类是回归问题。

分类问题很好理解,就像门口的垃圾桶,分为可回收,不可回收,垃圾分类,从我做起,人人有责。

分类问题是有答案的,是能列举出来的,比如某天肯定是周一到周天其中的一天,没有别的。

当训练分类问题的数据的时候,一般使用交叉熵当做损失函数。

交叉熵指两个概率分布之间的差异,公式如下:

 人话人工智能(3):小姐姐与损失函数

监督学习中,如果预测值和实际值交叉熵小,说明差异不大,我们的算法没问题。反之,就需要调整了,就像给媳妇挠痒痒那样,调完了再重新算一下。

举个例子,来说明损失函数在分类问题中的应用。

非诚勿扰中男嘉宾选择心动女生。

 人话人工智能(3):小姐姐与损失函数

男嘉宾通过层层了解,从女嘉宾的身材到脸蛋,从外貌到内涵,从生活习惯到喜不喜欢吃鸡蛋,对关键的输入通过损失函数进行一番计算,最后得出场上24位女嘉宾的交叉熵为:

[0.7,1,2,3,4,5,6,7,8,9,12,23,34,56,43,23,23,34,2,3,4,23,23232,23]

很明显,第一个和自己的梦中情人最接近。

那么,本次预测得出答案,1号女嘉宾就是自己的心动女生。

损失函数就是这么发挥作用的。

除了分类问题,还有回归问题。

回归问题只有一个答案,但是这个答案不确定。

不同于分类问题的今天是周几,回归问题是今天股票涨多少?可能是1,肯能是2,可能是3.1415926……

分类问题的损失函数交叉熵是和哪个更接近。

这个东西更煎饺还是更像锅贴,很好分类。

但是,如果到回归问题,今天的涨幅更像1还是2,是2.1,还是1.2,或者1653?没准!

很明显,交叉熵不适用回归问题了。

回归问题有自己常用的损失函数,那就是均方误差。

均方误差的公式如下:

 人话人工智能(3):小姐姐与损失函数

均方误差是所有预测值减去真实值的平方的平均数。

看公式,发现有一个显著的特点,就是当误差小的时候可以忽略,0.2^2=0.04;但是误差大的时候,会被放大20^2=400。平方就是有这个效果。

交叉熵和均方误差这两种经典的损失函数,看似很强大,但是解决实际需求还是欠缺。

倒不是他的算法欠缺,而是需求有点不正常。

比如预测商品的销量,预测的非常准真的好吗?

预测能卖100件,于是生产了100件,结果实际销售时,真的卖出去了100件,这样真的好吗?

程序员觉得好,算法准,不浪费。

但是老板不觉得好。

老板想的是利益最大化。

如果生产1个商品的成本是1元,利润是10元。

假如预测有误差。

少预测了一个,那么就损失一个的利润,也就是损失10元。

多预测了一个,那么只损失一个的成本,也就是损失1元。

这么看来,并不是越准越好,一定程度的多预测可以赚得更多。

这时,可以自己写一个损失函数,公式如下(a是损失的利润,b是损失的成本):

 人话人工智能(3):小姐姐与损失函数

以上就是损失函数的介绍,损失函数就像是一面镜子,让算法知道自己和标记样本之间的误差。

曾子曰:吾日三省吾身,为人谋而不忠乎?与朋友交而不信乎?传不习乎?

李世民说:夫以铜为镜,可以正衣冠,以史为镜,可以知兴替,以人为镜,可以明得失。

鲁迅说:多有不自满的人的种族,永远前进,永远有希望。多有只知责人不知反省的人的种族。祸哉,祸哉!

小韩说,以上古人都是在讲损失函数的重要性!