中国人工智能学会通讯——打造云上视觉智能生态 1.1 云上的大数据视觉智能...
今天和大家报告的主要是近两年在阿里云上做的视觉智能方面的工作和一些思考。
首先看一下人工智能的三次“春天”。第一次是在20世纪50年代,人工智能的概念首次提出,大家觉得人工智能在20年之内会改变世界,所有的工作都会被人工智能颠覆。但是后来很遗憾,10年以后发现不行,大家很失望。第二次是80年代,神经网络的提出,BP算法的提出,以及专家系统的初步结果,大家又很高兴,人工智能又要改变世界,取代很多人的工作,但是后来证明还是不行,人工智能又一次进入了低谷。第三次就是今天,这次是不是真的春天?昨天有一个论坛也在探讨这个问题。这次有一些不一样,有很多不同的观点,有人认为深度学习取得了很大的突破,计算能力大大提升,数据更多,网络带宽也大大增加。还有一个很重要的原因,我们已经看到一些结果,虽然这些结果离真正的智能还差很远,但是在一些领域已经取得了非常不错的结果,不管是闹着玩的还是真正在产业界的应用,都有一些可喜的结果。
1.1 云上的大数据视觉智能
人工智能技术将会改变哪些行业?先从视觉的角度看一看,视觉智能可以从云上做,也可以从端上做,我们今天就从云上来看。我们看看现在发生了什么样的事情,其实有的是发生了很多年的事情。
大家看这些图,左上角是交通的监控场景,右边和左下是治安和教育的场景,最后一个是直播。直播是主动的,前面三个是被动的。这些大量的数据,其价值有没有被充分发掘出来,这是一个很大的问题。例如,在全世界有数以亿计的摄像头,中国占了一多半,每年有几千万的摄像头被采购,中国一个一级城市里就有几十万的摄像头。大家可能也注意到一些,这些摄像头的数据到底是怎么被利用的,大家开车可能被处罚过,还有交警的控制中心经常要巡检查看,公安局里出了什么案件也需要调录像查看。仅有这些吗?投入了这么多,这些视频的价值怎么才能充分被挖掘出来,这是一个很大的问题。
再看个人的图像和视频数据,这个量也挺大,和我们每个人切身相关。我们每到一个好的地方、有好的风景,自己看没看没有关系,一定要让相机“看”一下。另外还有各行各业的数据,比如无人机的数据、工业的数据、医疗的数据,以及体育、娱乐、新闻等。这些大量的数据,在技术往前发展了一大步的今天,它们的价值能不能充分挖掘出来?
处理这样的数据,就是一个视觉大数据的问题。它的特点是显而易见,第一就是数据量非常大。视觉数据量最大的地方就在城市里面。有一些电视台有100万小时的数据,已经很多了,后来想一想,如果一个城市里有10万个摄像头,跑10个小时就是100万小时。第二是很多应用有实时性的要求。例如,交通红绿灯配时的自适应优化,就需要实时进行分析,实时做出决策。第三点就是数据的复杂度非常高,各种情况下的数据都有,各种应用的数据都有,数据的干净程度和质量都有很大的不同,需要完成的任务、开发的智能也都是不一样的,这就对算法的普适性提出了很高的要求。