蚂蚁金服、三星风投领投,这家由四名博士创办的中国 AI 公司获 4000 万美元 A+ 轮融资...
编者注:2016 年 AlphaGo 战胜著名围棋选手李世石之后,“人工智能”成了中国科技圈最时髦的口头禅,不管懂不懂,深度学习、神经网络这些专有名词都是信口拈来,采访必问“人工智能是否会取代人类”,各种人工智能的会议更是层出不穷,而人工智能创业公司的融资消息也是铺天盖地,融资额度也是一家比一家高。
以上种种现象,都说明了人工智能在中国到底有多火。但是,在这样一波热潮里,开发个 App 就算创业的时代已经一去不复返了,因为模式创新开始被技术创新所取代,而创业者的学历正在变得前所未有的重要。
2016 年 3 月,姚松、单羿、韩松、汪玉四位年轻的博士聚在一起,创办了深鉴科技,其中 90 后姚颂担任 CEO,单羿担任 CTO。有趣的是,这几位创业者都是清华大学电子系的校友。
和常见的纯算法创业公司不同,深鉴科技是一家 AI 芯片创业公司,主要提供基于原创的神经网络深度压缩技术和基于 FPGA 的 DPU 平台,为深度学习提供端到端的解决方案。
一年零七个月之后,深鉴科技终于召开了成立以来的第一场发布会,并宣布已经完成第三轮融资,金额高达 4000 万美元。然而,最值得关注的并不是融资金额,而是那些投资方。
以下是 AI 科技大本营整理的深鉴科技的融资情况:
2016 年 5 月,获得 500 万美元天使轮融资,投资方为金沙江创投和高榕资本;
2017 年 5 月,获得数千万美元的 A 轮融资,投资方包括赛灵思(Xilinx)、联发科、清华控股、方和资本,以及天使轮投资方金沙江创投、高榕资本;
2017 年 10 月,深鉴科技宣布完成 A+ 轮融资,由蚂蚁金服与三星风投领投,招商局创投与华创资本跟投,共融资约 4000 万美金。
作为全球最大的 FPGA 技术供应商,赛灵思的参投对深鉴科技有重要意义,而此次三星风投的加入,更是让人对深鉴科技的应用前景充满遐想,毕竟华为、苹果等都已经推出 AI 芯片,三星如果和深鉴科技合作推出 AI 芯片,那么市场前景将十分广阔。
不过,作为一家中国创业公司,为何深鉴科技能够获得赛灵思和三星等国际科技巨头的青睐?在营长看来,可以从技术和产品两个方面剖析一下。
技术方面
虽然深鉴科技创立还不到两年,但是实际上这几位创始人早在五年前就开始这方面的研究了,其中 CTO 韩松更是 FPGA 领域的个中翘楚。
2016 年 5 月,AI 顶级会议 ICLR 大会宣布两篇最佳论文,一篇来自 DeepMind,另一篇则来自深鉴的韩松——《深度压缩:通过剪枝、受训量化和霍夫曼编码压缩深度神经网络》(Deep Compression: Compressing Deep Neural Networks With Pruning,Trained Quantization And Huffman Coding)。
2017 年 3 月,韩松为第一作者的 ESE 语音识别引擎的论文( ESE: Efficient Speech Recognition Engine with Sparse LSTM on FPGA)更是在 FPGA 2017 上获得了唯一的最佳论文奖。
除了学界的奖项之外,CEO 姚颂在接受采访时更是自豪地表示,“在 OpenPOWER 2016 峰会中,赛灵思在讲到未来使用 FPGA 作为神经网络处理器加速标准时,所用的到的技术方面的 PPT 都是直接引用我们的公司的核心技术 PPT,包括压缩以及卷积神经网络的硬件结构等。”
此外,深鉴科技目前已经有 60 余项发明专利,虽然我们无法判断这些专利的创新性,但是已经足以说明深鉴科技对技术积累的重视。
产品方面
至于产品方面,深鉴的进度也非常快。在 10 月 24 日新品发布会上,深鉴一口气推出了六款智能产品,分别为视频结构化解决方案、人脸分析解决方案、人脸检测识别模组、深鉴 ARISTOTLE 架构平台、深鉴深度学习开发 SDK——DNNDK 以及深鉴语音识别加速方案,而前五款均为视频监控应用及相关解决方案。
其中,DNNDK(Deep Neural Network Development Kit)是深鉴科技面向AI异构计算平台DPU(Deep-Learning Processor Unit,深度学习处理器)自主研发的原创深度学习 SDK,为DPU 平台各种深度学习应用开发和部署提供的一套高效全栈式解决方案。
而 ARISTOTLE 则是针对卷积神经网络设计的一套高效的体系结构。韩松表示,在卷积神经网络这个应用当中,深鉴定义了几十条的指令集,而这些指令集的定义既不是一个二维的 vector,也不是一个三维的 tensor,而是四维的并行度,深鉴将四个维度的并行统一在一起,针对每一层的预算特性,动态地去分配不同的并行路上优先例子。
此外,深鉴科技还将于 2018 年上半年正式推出“听涛系列 SoC”。据介绍,听涛系列 SoC 将采用台积电 28nm 制程工艺,基于 DP4096 ARISTOTLE 核心,在 1.1W 的功耗下得到 4.1TOPS峰值性能。
编者手记
当然,技术和产品并不能决定一切,商业模式和应用前景也至关重要。
有人将深鉴比喻成中国版的英伟达,因为英伟达正式凭借着 GPU 和 CUDA 组成的生态系统,在 AI 时代异军突起,而深鉴科技的推出的 DPU 和 DNNDK 也是这种软硬结合的模式。
虽然目前英伟达的 GPU 在 AI 通用芯片市场市场仍占据绝对的优势,但是寒武纪的 NPU、深鉴的 DPU 等 AI 专用芯片也正在受到越来越多的关注,而且这些芯片低功耗的特性也特别适合部署在手机、监控摄像头等终端设备上,因此使用前景非常广泛。
寒武纪已经成为中国 AI 芯片市场的首个独角兽,深鉴科技显然也有成为下一个独角兽的潜力,毕竟,两者的核心团队全都是理工科博士。