何搏飞:计算机视觉开启人工智能新纪元

国内三大财经类报纸之一的《经济观察报》于2014年底推出重磅年终特刊——“三新公司”系列报道,对2014年致力于发展新技术,寻找新的商业模式,开拓新市场的公司做了综述性盘点,并对其中极具代表性的公司进行了专访报道。


格灵深瞳作为2014年年度“三新公司”的代表企业,日前接受了《经济观察报》的专访,以下是报道的内容:

何搏飞:计算机视觉开启人工智能新纪元

深冬,北京严寒逼人,34岁的张辉(化名)不远千里从西南边陲只身来到北京与颐和园仅一墙之隔的中式庭院,参加一场史无前例的“霸王面”。

这次面试能成的话,他打算辞去*刑侦大队长的职位。

张辉的机遇来自格灵深瞳CEO何搏飞抛出的“霸王面”,后者在浙江大学招聘会期间提出,“HR能把优秀的人的简历给筛出来吗?没准把很好的人才漏掉了”,于是他决定在2014年12月13日这天举行一场“丢掉简历、脱下西装”的霸王面。

不走寻常路的格灵深瞳在寻求方方面面的创新,其主业计算机视觉和人工智能在何搏飞看来是在打造下一个“风口”。

“技术控”的相遇

毕业于斯坦福大学商学院的何搏飞之前一直专注管理,其认为商业模式的创新固然具备改变现实的力量,但是要达到和互联网一个量级甚至超越它,必须要有核心技术。

何搏飞辞去跨国公司中国区总经理职位后,专心寻觅创业伙伴,在真格基金徐小平的牵引下,其赶赴与赵勇进行一场“交差式”的约谈。“说实话当时去没抱任何希望,就当是给老徐交个差。”

赵勇现任格灵深瞳的CTO,毕业于布朗大学计算机工程系,其曾是谷歌眼镜研发的核心成员,后来辞职回国创业。没想到本以为半小时能结束的约谈,从正午一直持续到半夜清凉。某种程度上,这是两个技术爱好者之间的交流,有相见恨晚之感。

何虽一直从事管理方面的工作,但对技术情有独钟,大学时代甚至还发明过纯机械化的自动冲水马桶。在交流中,他们发现志同道和,都想通过科技将人类彻底解放而后享受生活,由此格灵深瞳这家专注计算机视觉和人工智能的创业公司就降生了。

何搏飞认为人工智能将是下一个风口,而目前他们正在做的计算机视觉是开启人工智能的一扇门。他历数着人类历史上的三次革命性技术变革,向记者阐释每次变革都是将人类一步步从劳动中解放出来。何搏飞认为,当计算机能像人“感知”周围的环境事物,自主对外界刺激做出反应的时候,代替人做一些智力劳动,人们将会倾注更多精力从事艺术性创造和科学发明的工作。

在何搏飞的构想中,格灵深瞳将成为一个基于人工智能的平台。Google研究的无人驾驶汽车,目前已经能安全行驶一百万英里,计算机视觉在整个过程中扮演了重要角色。“操纵汽车、刹车,很容易做到;让汽车从A到B,GPS就能做到,但是路上有人穿行、有汽车加塞、变道,最难的就是让汽车感知周围发生了什么,进而做出反应,这就是计算机视觉在其中的作用。”何搏飞说。

感与知

“互联网冥冥之中就是像高等生物进化一样。”何搏飞如是阐释其对人脑构造和发育的研究。

人脑的神经元和突触相连形成一张深入的网络,这个系统承担了人体外部与内部相连的作用。人体接收外部刺激进而做出反应就在于这个系统的运作,同时外界信号的刺激也能够使得这个系统逐渐臻于完善。“人要变得聪明,神经元和突触要变得都很强大,需要见多识广、不断学习,其实这就是在获取大量的数据,计算机要做到这一点也需要获取海量的数据。”何搏飞说。

格灵深瞳目前专注的计算机视觉技术商业化应用的安防系统在何搏飞看来只是抛砖引玉,为将来的工作积累数据信息。每一种智能都需要训练,天生能够进行分类的人脑,同样需要不断的训练才能分辨出猫和狗,对于人工智能更是如此。“没有什么行业能够像安防监控一样能够给格灵深瞳这样海量的数据,去理解人的行为。”何搏飞说。

在人脑所接收处理的外部刺激信号中,超过一半是通过眼睛获取的。而格灵深瞳目前所做的计算机视觉,就好比获取数据信息的“眼睛”,能够实时正确地采集事物的一手信息,此为“感”。但人眼看到的是三维世界,而传统光学镜头所“捕猎”的世界是平面的,二维图像会形成偏差,离镜头近的事物成像就大,远的就小。格灵深瞳的不同之处,在于其利用新型传感器,实现三维视觉信息收集,力图向计算机真实“还原”这个世界,然后经过算法模型识别其中需要的数据,此为“知”。

“知”的层面,是通过被何搏飞视为核心技术的“连接”实现,即通过计算机的“深度学习”,向其输入海量数据,用惩罚奖励机制,训练计算机,形成一种算法模型,能够使彼此相关的信息联系起来,且这种联系能够为计算机所知,如此计算机在遇上某种情况的时候,能做出“反应”。

目前格灵深瞳在安防领域的商业化应用,不仅能够为其积累数据也能让外界逐渐熟悉公司。其工作原理是通过三维视觉感知技术,系统能够实现对人、物的精确检测、跟踪,对动作姿态(包括暴力、跌倒等危险行为)和人物运动轨迹(包括越界、逆行、徘徊等可疑轨迹)的检测和分析,识别其中的异常,向安保人员提供预警信号,主动提醒、报告异常。

格灵深瞳的技术可以解决安防领域目前面临的两个难题:看不见和找不到。一方面,能实现一段录像某个片段的精准定位与追寻。除了安防,格灵深瞳还将其技术应用到了消费者行为分析上,此前在北京新光天地购物中心的测试取得了很好的效果。

互联网的诞生将分散各地的电脑连接在一起,移动互联网的到来更是让这张网变得无时无刻都在处理信息,渐渐兴起的物联网让何搏飞兴奋不已。“互联网作为一个基础的平台使得人工智能变得越来越可能。”何搏飞说。

问答

经济观察报:你怎么看2014年中国经济发生的改变?

何搏飞:我觉得中国经济今年最大的变化就是创新性企业的逐渐走强。过去的一年,阿里巴巴成为全球最大的IPO企业、聚美优品上市、小米成立四年的估值达到400亿,超越Uber成为尚未上市的估值最高的公司。他们的特点都是利用了新的技术或者说新的商业模式,颠覆了过去人们的生活方式,所以说,我觉得创新企业的逐渐走强是今年经济最大的变化。

经济观察报:你如何理解在这个时代创新对一个企业的意义?你的公司在创新上遇到的最大挑战是什么?

何搏飞:过去创新对一个企业意味着机遇和发展,现在意味着生存,不创新就没有活路。原因有两个方面,一方面市场和消费者的需求越来越挑剔,如果你还在用过去的思路做事情很难满足他们的需求;第二现在竞争愈发激烈,现在的问题是你不创新就是等死,你不是在跟自己比速度,而是在跟竞争对手比速度。以前我们听过一个故事:你跟几个人走在森林里,后面有一头熊追过来,这时候你不需要跑的比熊快,你只要跑的比其他几个人快就行了。我觉得这个故事用来比喻企业创新是非常贴切的,这头熊代表的是旧的观念思路、渠道的这种摧枯拉朽的力量,如果你跑的没有别人快,那最先倒下的就是你。无论你是多么大的企业,过去的这几年,从诺基亚到国内也有很多这样的例子,大企业有的时候在面对创新的力量来临的时候反而反应更慢,倒下的速度也更快。创新对一个企业来说一定是生死存亡的事情。

说到挑战,不仅仅是我们这个企业,整个中国社会在创新上面临的最大挑战还是对于失败的包容。从这一点上来说,从团队内部来看,我们是不是可以接受并且容忍错误、挫折和失败,这对我们的投资人、对市场,是否可以接受创新带来的这种代价,这是个挑战。大家在享受创新所带来的跨越式成果的同时必须要接受一个现实就是大量的创新是会以失败的不断迭代来进行的。所以我觉得一个不能包容失败的文化是无法创新的文化,不管是对我们这个企业还是整个社会还是大家对这个问题的态度是决定创新能否真正进行的关键。

经济观察报:你所在的行业正在发生什么样的变化,这种变化给你带来了什么样的机会?

何搏飞:我们现在看到的一个巨大的行业变化就是整个互联网以及后互联网时代创业企业,从一开始解决人类共性的需求,它的势能已经逐渐到了尾声,现在到了解决每一个特定领域的需求的阶段。我们看到的这个在不断的孕育之中的势能就是人工智能,我们已经看到它在某些特定领域已经在极大的解放人的大脑,或者代替人做更为复杂的事情。我们的工作会把人从需要眼睛和大脑配合的高复杂程度的工作中解放出来,让人能够从事更高级、创造性更强的工作。这一天听上去好像很虚幻,但是随着我们这样的公司不断涌现,我们也看到趋势的车轮正不断的快速向前。


我是萌萌的分割线

如果你也喜欢这篇文章,请点击右上角按钮,分享至朋友圈

如果你想关注我们,点击页面上方蓝色小字格灵深瞳轻松关注;

如果你有任何疑问,欢迎随时留言,我们会及时回复。

何搏飞:计算机视觉开启人工智能新纪元