人工智能基础知识(一)
目录
1.起源和定义
如果不做很远的追溯,现代人工智能的起源就非常明确。现代人工智能起源公认是1956年达特茅斯会议。该会议主要参加者有10人,分别是麦卡锡,明斯基,香农,罗切斯特,纽厄尔,西蒙,萨缪尔,伯恩斯坦,摩尔,所罗门诺夫,其中前四位是发起人。会议的主要成就就是使人工智能成为一个独立的研究学科。人工智能的英文名称是“Artificial Intelligence”。
时至今日,仍然没有一个一致被认同的人工智能定义,常见的有两种,一是明斯基提出的:
- 人工智能是一门科学,是使机器做哪些人需要通过智能来做的事情
另一种更专业的定义是尼尔森给出的:
- 人工智能是关于知识的学科,所谓“知识的学科”就是研究知识的表示,知识的获取和知识的运用
2.人工智能的流派
为了说清楚三个流派怎么来的,我们先从知识说起。
关于知识,有一点是明确的,那就是知识的基本单位是概念,精通掌握任何一门知识,必须从这门知识的基本概念开始学习,而知识本身也是一个概念,如何定义一个概念对于人工智能具有非常重要的意义。有兴趣的同学可以读一读《哥德尔、埃舍尔、巴赫:集异壁之大成》,该书对于概念自指有一些非常深入浅出的例子。
知识本生也是一个概念这件事非同寻常,据此人工智能的问题就变成如下三个问题:
- 如何定义一个概念
- 如何学习一个概念
- 如何应用一个概念
问题一,如何定义一个概念?这里先讨论最为简单的经典概念,经典概念的定义有三部分组成:
概念的符号表示 | 概念的内涵表示 | 概念的外延表示 |
说明这个概念叫什么 | 由命题表示,命题是能判断真假的陈述句 | 由经典集合来表示,用来说明概念对应的实际对象是哪些 |
举个例子:素数。
那么概念有什么用呢?
经典概念定义的散步各有其作用,且彼此不能相互替代。具体来说,要掌握一个概念,必须清楚其三个功能。
- 指物功能。 即指向客观世界对象,表示客观世界的对象的可观测性。对象的可观测性是指对象杜宇人或者仪器的知觉感知特性,不依赖于人的主观感受。
- 指心功能。 即指向人心智世界里的对象,代表心智世界里的对象表示。比如你心中的“女神”。
- 指名功能。 即指向认知世界或者符号世界表示对象的符号名称,这些符号名称组成各种语言。如何汉语中的“雨”和英语中的“rain”。
知道概念的三个功能后,就可以理解人工智能的三个流派以及各流派之间的关系,人工智能也是一个概念,而要使一个概念成为现实,自然要实现概念的三个功能。人工智能的三个流派关注与如何才能让机器具有人工智能,并根据不同功能给出了不同的研究路线。专注于实现AI指名功能的人工智能流派成为符号主义;专注于实现AI指心功能的人工智能流派成为连接主义;专注于实现AI指物功能的人工智能流派成为行为主义。
2.1 符号主义
符号主义的代表人物是Simon和Newell,他们提出物理符号系统假设,即只要在符号计算上实现了响应的功能,那么现实世界就实现了对应的功能,这是只能的充分必要条件。因此符号主义认为,只要在机器上是正确的,现实世界就是正确的。通俗一点就是:指名对了,指物自然正确。
在哲学上,关于物理符号系统假设也有一个著名的思想实验——图灵测试。图灵测试要解决的问题就是如何判断一台机器是否具有智能。有了图灵测试,我们就可以将研究智能的终点放在智能的外在功能性表现上,使智能在工程上看似乎是可以实现的。
图灵测试将智能测试的表现完全限定在指名的功能里。但只在指名功能里面实现了概念的功能,并不能说明一定实现了概念的指物功能。实际上指名与指物不同,哲学家Searle专门设计了一个思想实验用来批判图灵测试,这就是著名的中文屋实验。中文屋的实验明确说明,即使符号主义成功了,这全是符号的计算跟现实世界也不一定搭界,即完全实现指名功能也不见得具有智能,这是哲学上对符号主义的一个正式批判,明确指出了按照符号主义实现人工智能不等同于人的智能。
虽然如此,符号主义在人工智能研究中依然扮有重要角色,其早起的工作主要成就体现在机器证明和知识的表示上。机器证明后,符号主义最重要的成就就是专家系统和知识工程。
符号主义面临的显示挑战主要有三个:
- 第一个是组合爆炸的问题,每个人掌握的概念大约为5万个,其形成的组合概念确是无穷的,因为常识难以穷尽。推理步骤可以无穷
- 第二个是命题的组合悖论问题,两个都是合理问题合起来变成了没法判断真假的句子了,比如著名的柯里悖论。
- 第三个问题也是最难的问题,即经典概念在实际生活当中是很难得到的,只是也难以提取
2.2 连接主义
连接主义认为大脑是一切智能的基础,主要关注于大脑神经元及其连接机制,师徒发现大脑的结构及其处理信息的机制,揭示人类智能的本质机理,进而在机器上实现相应的模拟。因此连接主义主要关注于概念的心智表示以及如何在计算机上实现其心智表示,这对应着概念的指心功能。
早期连接主义认为可以完全实现人工智能,对此哲学家普特南设计了著名的“缸中之脑实验”,可以看出是对连接主义的一个哲学批判。缸中之脑实验说明即使连接主义实现了,指心没有问题,但指物依然存在严重问题,因此,连接主义实现人工智能也不等同于人的智能。
尽管如此,连接主义仍是目前最为大众所知的一条AI路线。在围棋上,采用深度学习技术的AlphaGo战胜了李世石,之后又战胜了柯洁。在机器翻译上,深度学习技术已经超过了人翻译的水平。在语言识别和图像识别上,深度学习也达到实用水准。客观的说深度学习已经取得了工业级的进展。
但是,这并不意味这连接主义就可以实现人的智能。要实现完全的连接主义,也面临极大的挑战。到现在为止,人类不清楚人脑表示概念的机制,也不清楚人脑中概念的具体表示形式,表示方式和组合方式等,现在的神经网络与深度学习实际上与人脑的真正机制距离尚远,并非人脑的运行机制。
2.3 行为主义
行为主义假设智能取决于感知和行动,不需要知识,表示和推理,只需要将智能行为表示出来就好,即只要实现指物功能就认为具有智能了。对此,哲学家普特南也设计了一个思想实验,可以看作是对行为主义的哲学批判,这就是“完美伪装者和斯巴达人”。完美伪装者和斯巴达人的外在表现都与内心没有联系,这样的智能如何从外在进行测试?因此,行为主义路线实现的人工智能也不等同于人的智能。
对于行为主义路线,其面临的最大实现困难可以用莫拉维克悖论来说明。所谓莫拉维克悖论是指对计算机来说困难的问题是简单的,简单的问题是困难的,最难以复制的反而是人类技能中哪些无意识的技能。目前,模拟人类的行动面临很大的挑战。比如,波士顿动力公司人行机器人可以做高难度的后空翻,大狗机器人可以在任何地形负重前行,但都有很大的缺点:噪音过大,能耗过高,动作僵硬,缺乏实用价值。
3. 知识和知识表示的概念
知识是人们在长期的生活实践中,在科学研究以及实验中基类起来的对客观世界的认识和经验。人们吧实践中获得的信息关联在一起,就行程知识。一般来说,吧有关信息关联在一起所形成的信息结构称为知识。信息之间有多重关联形式,其中用的最多的一种是用“如果……,则……”表示关联的形式,在人工智能中,这种知识被称为“规则”,它反映了信息见的某种因果关系。如果我国北方人根据观察得出“大雁南飞”与“冬天要来临了”这两个信息关联在一起。
3.1 知识的特性
相对正确性 |
知识是人类客观认识师姐的结晶,并且受到长期实践的检验,因此,在一定条件及环境下,知识是正确的。这里“一定环境及条件”是必不可少的,它是知识正确性的前提,因为任何知识都是在一定的环境下产生的。 |
例如,牛顿定律在一定的条件下才是正确的, 再如:“1+1=2”,这是常识,但是它也只是在十进制的前提下才是正确的 |
不确定性 |
由于现实世界是复杂的,信息可能是精确的,也可能是不精确的,模糊的。这就使知识并不总是只要“真”和“假”这两种状态,而是在真假之间还存在许多中间状态,造成这种不确定性的原因主要有:
|
例如:三国周郎赤壁,就是因为天气的不确定性,冬天居然有东南风。 |
可表示性和可利用性 | 知识课表示性是指知识可以以适当的形式表示出来,如语言文字,图形,神经网络等,这样才能被传播。知识的可利用性是指知识可以被利用,这是不言而喻的。 |
3.2 产生表示法
产生表示法又称产生规则表示法。“产生式”这一术语室友美国数学家波斯特在1943年提出来的,如今已被应用于多领域,成为人工智能中应用最多的一种知识表示方法。
产生式通常表示事实,规则以及他们的不确定性度量,适合于表示事实性知识和规则性知识。
确定性规则产生式表示 | IF P THEN Q 或者 P |
P是产生式前提,用于指出该产生式是否可用的条件
|
不确定性规则的产生式表示 | IF P THEN Q (置信度) |
如:IF 本微生物的染色班是革兰氏阴性,本微生物的形状呈杆状, |
确定性事实的产生表示 |
(对象,属性,值) (关系,对象1,对象2) |
(Li,Age,40)表示老李的年龄是40岁 |
不确定事实的产生式表示 |
(对象,属性,值,置信度)或 (关系,对象1,对象2,置信度) |
(Li,Age,40,0.8)表示老王年龄很可能是40岁 (Friend,Li,Wang,0.1)老李和老王不大可能是朋友 |
3.3 产生式系统
吧一组产生式系统放在一起,让他们相互配合,协同作用,一个产生式生成的结论可以供另一个产生式作为一只的事实使用,一求得问题的解,这样的系统成为产生式系统。一般来说,一个产生式系统由规则库、综合数据库、控制系统(推理机)三部分组成。关系如图:
规则库:用于描述相应领域内知识的产生式集合称为规则库。显然规则库是产生式系统求解问题的基础,因此,需要对规则库中的知识进行合理的组织和管理,检测并排除冗余及矛盾的知识,保持知识的一致性。
综合数据库:综合数据库又称为事实库、上下文、黑板等。用于存放问题的初始状态,原始证据,推理中的带的中间结论及最终结论等信息。
推理机:推理机由一组程序组成,除了推理算法,还控制整个产生式系统的运行,实现对问题的求解。主要包含以下几个工作:
- 推理。按一定的策略从规则库中选择与综合数据库中的已知事实进行匹配。所谓匹配是指把规则的前提条件与综合数据库中的知识事实进行比较,如果两者已知或者近似且满足预选规定的条件,则称匹配成功。
- 冲突消解。 如果匹配成功的规则不止一条,成为“发生了冲突”。此时,推理机必须强调用相应的解决冲突策略进行消解,以便成功的贵则中选出一条执行。
- 执行规则。
- 检查推理终止条件。
4. 框架表示法
框架是一种描述所论对象属性的数据结构。
一个框架有若干被称为“槽”的结构组成,每一个槽又可根据实际情况划分为若干个“侧面”。一个槽用于描述所论对象某一方面的属性。一个侧面用于描述相应属性的一个方面。槽和侧面所具有的属性值分别被称为槽值和侧面值。
<框架>
槽名1: 侧面名 侧面值
,侧面值
,侧面值
,……
侧面名 侧面值
,……
槽名2: 侧面名 侧面值
, ……
……
给个例子:
教师框架
框架名: <教师>
姓名: 单位(姓,名)
年龄: 单位(岁)
性别: 范围(男,女),缺省: 男
职称: 范围(教授,副教授,讲师,助教),缺省:讲师
部门: 单位(系,教研室)
住址: <住址框架>
工资: <工资框架>
开始工作时间: 单位(年,月)
该框架共有9个槽,分别描述了教师的九个属性。一个框架还可以实现对另一个框架的调用,表示框架之间的横向联系,约束条件是可选的,当不指出时,表示没有约束条件。
5. 状态空间表示法
状态空间是利用状态变量和操作符号表示系统或问题的有关知识符号体系,状态空间是一个四元组,从
节点到G节点的路径被称为求解路径。状态空间的一个接是一个有限的操作算子序列,它使初始状态转换为目标状态。
关于状态空间表示法的详细教程可以参考八数码问题。