机器学习从入门到创业手记-1.2 机器学习的概念

坐在公司宽敞的会议室里,面前是一杯现煮的咖啡,公司的CEO 站在大的投影屏幕前意气风发,举手投足间透露出成功人士的魅力。

 

“首先欢迎各位加入爱视达智能科技有限公司,我是公司的联合创始人 David 王,曾经在Google中国工作过,看到你们就和那时的自己一样充满了朝气,我代表着公司的过去,你们则代表着公司的未来,希望各位同仁精诚团结,爱视达智能必将成为行业领军企业,你们在今后的三个月里会接收到公司全方位的培训,今天我先会给大家介绍公司的背景,业务,以及你们将要加入的项目。”

 

说着David王打开了投影仪,培训的PPT展现在了我们面前:

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页1

 

 

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页2

 

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页3

 

 

David王旁白:这部电影你们每个人都要去看一下,这个影片能很好的阐述了人工智能的愿景,这也是我们公司团队的一直为之努力的方向,人工智能最早的定义来自于1956年麻省理工学院的约翰.麦卡锡, 人工智能就是要让机器的行为看起来就像是人所表现出的智能行为一样,人工智能又分为强人工智能和弱人工智能两类观点,强人工智能的支持者认为有可能制造出真正的具有推理和解决问题能力的智能机器,并且具有自我意识。而弱人工智能则认为所谓智能机器只不过是看起来是智能的,实际上不具备自我意识,没有任何自我学习推理能力。就目前阶段而言我们能做到的都是弱人工智能,是否能实现强人工智能需要更多交叉学科共同的努力。评判我们是否实现了强人工智能的手段是图灵测试,如我问你叫什么名字?你说你叫XXX,我再问一遍你叫什么名名字,你还回答我叫XXX,若我每次问你叫什么名字,你都回答我叫XXX,那么我可以断定这是弱人工智能,而当我第二遍问你叫什么名字时,你回答我刚不是说过了么,再问下去,会有接近于人行为的反馈时,让提问者感觉不到对方是人而不是机器时,我们认为其可以通过图灵测试属于强人工智能。

 

       机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页4

 

       David 王旁白:人工智能在很多行业都取得了不错的成绩,我列举出了四个我认为目前应用最成熟的支柱领域,这里通过网络和高性能计算机已经能完成对于现有海量知识的检索和存储,搜索引擎技术可以提供关键与关联信息的提取,以google的无人驾驶汽车项目为例,该无人驾驶汽车目前已经累计达到70万英里无事故,其可以识别打出左转手势的骑车者,路边跑出的小动物,限速标志等等各种之前只有人类才能完成的操作,而其做出反应的速度更是远远领先人类,这个项目应用了模式识别,机器学习,各种智能算法,是人工智能领域的集大成者。

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页5

 

 

       David王旁白:大部分人工智能创业公司都是技术出身,从理念和架构上,都会偏重于技术的优势,而忽略的管理与营销,就算找到了用户的痛点也不知道如何将产品推给客户,公司内部运营也是一团糟,财务预算,项目管理都没有规章可寻,所以技术,管理与营销并重才是公司成功的基础,而营销整合了供应链,产品链,客户链和媒体链,是公司变现的最直接的渠道,所以在座的各位实习生如果你们被分配到营销岗位不是因为你的能力差,而是公司更希望你在合适的岗位发挥自身优势。

 

       “好的,人工智能的介绍就是这么多,后面由公司的技术团队会给大家开始技术基础培训,大家欢迎。”David王鼓掌坐下。

 

       “大家好,我是公司基础软件部的李里,接下来几天你们的培训都是由我带领开展。”,这位李里看着应该也是刚毕业不久,脸上也是稚气未脱。

 

“公司分为基础软件部负责构建各个项目需要各种软件开发库接口等,平台软件部负责公司智能平台的开发,QA部门是Quality Assurance的缩写,是质量保证部门,负责验收测试我们开发的各个产品,PM部门是产品经理部门,这个部门负责制定产品功能,项目规划等,是个一个产品的灵魂。接下来的我会给大家讲解机器学习基础概念的相关内容。”

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页6

 

       李里旁白:机器学习是英文Machine Learning的直译,简称ML,Machine一般泛指计算设备。这个名字使用了拟人的手法,说明了这门技术是让计算设备具有学习的能力。但是计算设备是机器,怎么可能像人类一样“学习”呢?应该怎么做才能让计算机也能拥有人类的学习能力呢?

 

传统上如果你想让计算设备工作,那么通常做法是给它一串指令,然后它遵照这个指令一步步执行下去。但这样的方式在机器学习中行不通。机器学习不能理解你输入的指令,它只能接收你输入的数据! 也就是说,机器学习是一种让计算设备利用数据而不是指令来进行各种工作的方法。这听起来非常有趣,因为你不再需要清楚每个指令的执行过程与结果。这里机器学习是以“统计”的思想来处理相关数据,所以统计学是必不可少的基础知识,相关而不是因果的概念将是支撑机器学习能够工作的核心概念。

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页7

李里旁白:开篇用一个不会拍照的男朋友来解释机器是如何学习的,请看PPT页6中的对话,你有没有这样经历呢?开始女朋友在埋怨你的照相技术,因为你确实也不是个这方面的高手,这时女朋友充当起教练的角色,对于你每次拍照结果进行评判并告诉你对应的改进方面,你也不断的去改善,直到女朋友满意为止,这个过程你就和机器一样,要根据女朋友摆出的姿态,光线,场景等这些输入完成一个符合预期的输出,也就是可以接受的照片,当不符合预期时,你会知道哪里做的不好然后进行改善,直到符合预期,这时你也变成了很厉害的拍照高手,再有类似的场景你都会拍出很漂亮的照片,这个过程就符合机器学习的过程。

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页8

 

李里旁白:在机器学习领域一直都是科技大公司来领导方向的,你们可以关注一些业内专家的研究Paper及大公司的发展动态,PPT页7介绍的三人是当今机器学习界的执牛耳者。中间的是Geoffrey Hinton, 加拿大多伦多大学的教授,如今被聘为“Google大脑”的负责人。右边的是Yann LeCun, 纽约大学教授,如今是Facebook人工智能实验室的主任。而左边的大家都很熟悉,Andrew Ng,中文名吴恩达,斯坦福大学副教授,如今也是“百度大脑”的负责人与百度首席科学家。这三位都是目前业界炙手可热的大牛,被互联网公司争相高薪聘请,论文引用数量也是名列前茅,足见他们的理论的重要性。虽然同为业内翘楚,但他们的观点与采用的方法论也不尽相同,目前机器学习的方法论大体分为几种流派,大家参看PPT页8。

机器学习从入门到创业手记-1.2	机器学习的概念

PPT 页9

 

这时已经快到了中午12:00点,李里说:今天上午过的很快,学到的东西都有限,但我还是要布置一下培训的作业,下午你们九人合作完成将机器学习的流派历史发展写到会议室的电子白板上,这些在互联网上都有,你们重要的总结提炼,最后写出机器学习技术的未来发展方向,你们一定要锻炼从互联网上搜索答案的能力。

 

一上午就这么懵懵懂懂的过去了,来到餐厅吃饭时总算有了个轻松环境,大家也开始交流起来,“我叫路思,毕业于华北理工计算机专业”,坐我旁边的男生率先自我介绍起来,“刘思聪,北京联合大学信息专业”,“高维,江南大学电子商务专业”,就这样大家一一介绍也从陌生到熟悉。

 

转天早上,李里走进会议室也看到了电子白板上我们完成的作业:

1980 年代

  • 主导流派:符号主义
  • 架构:服务器或大型机
  • 主导理论:知识工程
  • 基本决策逻辑:决策支持系统,实用性有限

1990 年代到 2000 年

  • 主导流派:贝叶斯
  • 架构:小型服务器集群
  • 主导理论:概率论
  • 分类:可扩展的比较或对比,对许多任务都足够好了

2010 年代早期到中期

  • 主导流派:联结主义
  • 架构:大型服务器农场
  • 主导理论:神经科学和概率
  • 识别:更加精准的图像和声音识别、翻译、情绪分析等

2010 年代末期

  • 主导流派:联结主义+符号主义
  • 架构:许多云
  • 主导理论:记忆神经网络、大规模集成、基于知识的推理
  • 简单的问答:范围狭窄的、领域特定的知识共享

2020 年代+

  • 主导流派:联结主义+符号主义+贝叶斯+……
  • 架构:云计算和雾计算
  • 主导理论:感知的时候有网络,推理和工作的时候有规则
  • 简单感知、推理和行动:有限制的自动化或人机交互

2040 年代+

  • 主导流派:算法融合
  • 架构:无处不在的服务器
  • 主导理论:最佳组合的元学习
  • 感知和响应:基于通过多种学习方式获得的知识或经验采取行动或做出回答

       总结:通过历史可以看到机器学习一个发展规律,那就是技术融合。

李里:总结的还不错,但技术融合只是一个重要的技术发展方向,从宏观上我认为如何让计算设备能像人一样能从非常小的样本中进行有效的学习是未来整体机器学习需要重点研究的方向,这里需要让计算设备具备知识图谱,逻辑推理,符号学习等能力相结合。