嵌入式关联产品之NVIDIA Jetson

概述

NVIDIA Jetson是NVIDIA公司嵌入式单板计算机的一系列。Jetson是以机器学习应用为目的而设计的,具有GPU的并行处理用的嵌入式计算板,用于高速执行图像识别、机器学习和自动驾驶等。

爆炸式增长的AI模型的复杂性

近年来,由于传感器技术的革新,IoT设备比以往发挥了更高的性能。与此相伴,自动驾驶汽车、机器人等自主型机器、智能家居等的活用事例正在日益增加,但另一方面也产生了几个课题。一个是边缘设备上处理的数据量预计会庞大到不能发送到云上,另一个是边缘设备上的数据处理要求实时性。另外在工厂内或家庭内运行的边缘设备存在隐私问题,因此也可能导致在云上上传数据变得困难。由于这些原因,将数据处理在边缘设备上高效且在IoT设备上嵌入AI的必要性增加。
嵌入式关联产品之NVIDIA Jetson
另一方面,边缘设备的嵌入式AI开发存在与传统嵌入式软件开发不同的固有挑战。其中之一就是对每天出现的新神经网络模型的应对能力。随着AI领域开发快速发展,AI模型的复杂性和多样性也在爆发式增长。例如,2014年在图像分析竞赛“ILSVRC(ImageNet Large Scale Visual Recognition Challenge)”中获胜的AI模型“GoogLeNet”的参数个数约为670万个左右,而2018年谷歌发布的自然语言处理模型“BERT”的参数数增至约34亿个。鉴于此,在选定AI计算机方面,重要的是选择具有灵活性的产品,不仅可以支持目前的AI模型,还可以支持未来可能出现的AI模型。

嵌入式关联产品之NVIDIA Jetson

专为自主机器开发人员设计的AI计算板

NVIDIA Jetson解决了这些问题,并允许通过软件定义(SD)开发自主机器。作为构成NVIDIA Jetson的主要支柱(柱),提出了AI计算机“Jetson”系列、面向Jetson的SDK等软件、支持充分利用Jetson开发的生态系统这3个类别,并依次进行了介绍。
嵌入式关联产品之NVIDIA Jetson
Jetson系列是SoM(System on Module:系统上模块)的AI计算板,针对边缘设备的嵌入式AI开发进行了最佳设计。它搭载了在边缘设备上驱动AI应用所需的GPU和DRAM(Dynamic Random Access Memory:动态随机存取存储器)等所有存储器类,可以满足与应用相对应的各种性能要求。产品组合目前除了高端型号的“Jetson AGX Xavier”系列之外,还准备了入围型号的“Jetson Nano”、“Jetson TX2”系列和“Jetson Xavier NX”四种。

NVIDIA的阿米特提到Jetson AGX Xavier时强调:“我们不仅单纯地说要加速AI开发,我们还从一开始就设计和开发了一种设备,它具备足够的性能来开发自主式机器。”实际上,Jetson AGX Xavier虽然是10~30W的低功耗,但最大实现了32TOPS(Tela Operations Per Second:以Terra为单位计算每秒的操作数的值)和高性能,成为能够承受在边缘设备上的运用的性能。

Jetson AGX Xavier除了可以处理大规模矩阵运算的”Volta Tensor Core GPU“之外,还配备了实现高性能的8核”Carmel ARM V8.2CPU“,以及加速AI推理处理的深度学习(深层学习)加速器。通过这些要素的组合,可以开发出在实际现场所要求的自主型机器。
嵌入式关联产品之NVIDIA Jetson

加快AI处理的SDK“JetPack”

接下来的是面向Jetson的SDK软件群。核心是“JetPack”,它封装了使用Jetson系列开发AI所需的软件工具。JetPack除了LinuxOS(Operating System:操作系统)之外,还由与其内核和源等一并打包的BSP(Board Support Package)、包含使深度学习操作高速化的库“CuDNN”的GPU高速化库“CUDA-X”等构成。

嵌入式关联产品之NVIDIA Jetson
特别是SDK“TensorRT”作为CUDA-X的关键库,实现具有高性能推理能力的AI开发的重要性。
“TensorRT具有可以利用与TensorFlow和Pytorch等主要AI开发框架相对应的编译器的特征。此外,您还可以将AI部署到边缘设备上,同时将内存使用量降至最低,同时充分利用Jetson的架构实现最大限度的推理性能。

除了JetPack之外,面向Jetson的SDK还包括“DeepStream”(DeepStream)和“Isaac”(Isaac),该“DeepStream”允许实时分析流媒体视频,“Isaac”封装了机器人开发工具。

DeepStream是允许构建流媒体视频的IVA(Intelligent Video Analytics:智能视频分析)应用程序的SDK。
利用DeepStream,您可以使用Jetson安装的GPU资源,快速识别IoT设备和监控摄像机收集的视频中的物体。另外,不仅是物体识别的过程中的推论处理,还可以使从动画的捕捉到动画数据的解码、动画内映出的物体的跟踪、识别结果的显示显示等一系列的处理过程全部高速化。

Isaac封装了机器人开发所需的框架和库。具体而言,除了提供应用框架的“Isaac Robotics Engine”之外,还包括活用深度学习的识别算法等软件包“Isaac GEM”,以及提供机器人开发的模拟环境的“Isaac Sim”等。

嵌入式关联产品之NVIDIA Jetson
嵌入式关联产品之NVIDIA Jetson