《数据聚类》书籍序言阅读摘抄及思考——关于人工智能未来研究

《数据聚类》一书为张宪超所著,其中一些东西总结得很好,故而摘抄。此书可为研究无监督学习入门的必备书目之一。


《数据聚类》书籍序言阅读摘抄及思考——关于人工智能未来研究

注:图片引用来自http://product.dangdang.com/25107942.html


序———–精彩部分摘抄

“2007年,关系型数据库鼻祖、图灵奖德祖Jim Gray提出了科学研究的第四范式,即数据密集型科学发现,在此之前人类认知世界的方式经历了三个阶段的飞跃:第一范式是实验科学,从原始的钻木取火发展到后来以伽利略为代表的文艺复兴时期的现代科学发展初级阶段。第二范式是理论科学,从经典的牛顿力学到量子力学和相对论,人们以超凡的头脑思考超越实验设计。第三范式是计算科学,20世纪中叶以来,人们通过对复杂现象进行计算机模拟仿真实验,推演出越来越复杂的现象,如模拟核试验、天气预报等。第四范式是指随着数据的爆炸性增长,计算机将不仅仅能做仿真实验,还能进行分析总结。科学的第四范式必将推动人类认知世界能力的一次新的革命。”

“然而,要发挥大数据的作用,必须具备强大的数据分析能力。因此与大数据概念同步火爆的概念还有人工智能的再度爆发。大数据和人工智能是科学第四范式必不可少的两个方面:没有人工智能,大数据就是埋藏在深山里面的金矿;没有大数据,人工智能是巧妇难为无米之炊。”

“人工智能的核心是机器学习,其首要任务是对事物进行辨识和区分。机器学习分为有监督学习和无监督学习两大类。监督学习的主要任务是分类,即用大量已标记的数据完成对新数据的区分;无监督学习的主要任务是聚类,即在没有任何人工干预的情况下对数据进行区分。”——中国科学院院士 陈国良

以上是本书在序中的精彩部分的摘抄,几段话对于理解机器学习和整个人工智能的发展有着很大的帮助!人工智能近些年来飞速发展只不过是人类整个社会进步的一个缩影,这是应该深刻认识到的,并不是人工智能的发展推动了社会的发展,而是整个社会在经济、科技、教育、文化、卫生等方面的进步给予了人工智能发展良好的沃土,这是历史发展到这一个阶段的必然。

前言———–精彩部分摘抄

“目前,深度学习基本上只带来监督学习的进步,但仅依靠监督学习是无法实现完整的人工智能的。作为智能系统,监督学习似乎足够‘能’而不足够‘智’。足够‘能’体现为它能够在大数据中挖掘知识,这仅是人脑做不到的。事实上,人脑并不是处理大数据的系统,人类在任何领域所掌握的知识有限,例如每个人仅能识别千个汉字和单词。不足够‘智’体现为监督学习需要大量人工标记的训练样本。人脑的学习并不需要大量的样本训练,人类是在没有知道或少量指导的条件下获得知识的,而且人脑会不断学习并强化自己在各个领域的知识。人类在有限知识的基础上体现出惊人的创造力。类似人脑的智能系统更需要无监督学习、小样本学习、强化学习和迁移学习等功能因此人工智能的发展仍然任重而道远”——大连理工大学教授 张宪超

并不是说拥有海量的数据,从中发现规律就可以了,那些还远远不够,根据知识形成相应的价值和判断规则,这是学习的一个重要环节,对于机器运作来说也是很有帮助的。因为人类的学习和辨别能力的增长,很多程度来自于知识的输入和输出,但更重要的,是通过知识来形成一套可供判断和评价的依据,或是可以遵循的推理规则,不单纯依赖于情感。


所有,有人说,未来,也许人工智能应该会至少有两个方向,要么越来越像人,具备一定人的推理判断能力,要么便是一个新生的物种,具有感情和思考能力,他们属于自然界的一个新生群体。