Netra基于Rdk平台的软件框架设计 Netra(DM8168)处理器是个多核处理器,每个核之间相互独立却又相互关联,如何高效简洁地利用每个核完成一套系统功能是非常关键的,RDK这...

Netra(DM8168)处理器是个多核处理器,每个核之间相互独立却又相互关联,如何高效简洁地利用每个核完成一套系统功能是非常关键的,RDK这套软件平台就是针对这种多核平台设计的一套多通道视频应用方案,主要用于DVRNVR、IPNC之类的产品。

这个软件框架结构允许用户创建不同的多路数据流来实现视频的采集、视频处理(DEI、Noise Filter、Encode、Decode、SwMs、Merge等)和视频播放功能,其框架设计非常值得学习。


以下为相关缩写解释:

*****************************************************************************************************

HDVPSS:High Definition Video Processing Subsystem

HDVICP:High Definition Video and Image CoProcessor

Ducati:Dual Core M3 Processors controlling HDVPSS and HDVICP hardware engines

Video M3:ARM Cortex M3 Core(inside Ducati subSystem)controlling HDVICP codecs

VPSS M3:ARM Cortex M3 Core(inside Ducati subSystem)controlling HDVPSS,also called DSS M3

DEI:Deinterlacer

McFW:Multi Channel Framework

IPC:Inter Processor Communication

******************************************************************************************************

1、Rdk平台软件框架图

在Rdk平台软件中做了很好的分层,如下图所示:

Netra基于Rdk平台的软件框架设计
Netra(DM8168)处理器是个多核处理器,每个核之间相互独立却又相互关联,如何高效简洁地利用每个核完成一套系统功能是非常关键的,RDK这...

注意:上图中核间通过Syslink/IPC通信,任意2个核之间都可以直接通信,是一个星型网络,上图画的连接关系描述的是对等层次的概念。

上图中相关层的功能及相关描述如下表所示:

处理器 描述 相关TI软件包
Linux HOSTA8

LinuxOS,includes,filesystems,

SATA,Ethernet,USBandother

IOdrivers

LinuxPSP
BIOS6

VPSSM3

VideoM3

DSP

BIOSRTOSusedasOSon

Video-M3,VPSS-M3,DSP.

Providesfeatureslikethreads,

semaphores,interrupts.

Queuesandmessagepassing

betweenlinksisimplemented

usingBIOSsemaphores.

BIOS

XDC(usedforBIOSand

otherconfiguration)

Syslink/IPC

HOSTA8

VPSSM3

VideoM3

DSP

SoftwareAPIsusedfor

communicatingbetween

processors.Providesfeatures

likeprocessorloadingand

booting,multiprocessorheaps,

multiprocessorlinkedlist

(ListMP),messagequeues,notify etc

Syslink

IPC

HDVPSS

Drivers

VPSSM3

HDVPSSdriverslikecapture,

display,deinterlacer,scaling

basedonFVID2interfaceto

controlandconfigurethe

HDVPSSHW

HDVPSS

Video

Encode/Decode

VideoM3

Videoencode/decodeAPIs

basedonXDM/XDIASinterface.

Usesframeworkcomponentsforresourceallocation

XDIAS

Frameworkcomponents

IVAHDHDVICP2API

H264decoder

H264encoder

Links

LinksHOSTA8

VPSSM3

VideoM3

DSP

Implementationofindividual

links.Somelinksarespecificto

aprocessorwhilesomelinksarecommonacrossprocessors

DVRRDK
LinkAPI HOSTA8

ThelinkAPIallowsusersto

create,connect,andcontrol

linksonHOSTA8,VPSSM3,

VideoM3andDSP.

LinkAPIisusedtocreateachainoflinkswhichforms

auserdefineduse-case.

Theconnectionoflinkstoeach

otherisplatformdependant.

McFW
McFWAPI HOSTA8

Multi-ChannelFrameWorkAPI.

Multi-ChannelApplication

specificAPIwhichallowsusertosetupandcontrolpre-defined

applicationspecificchainsfor

DVR,NVR,usingasinglesimplifiedAPIinterface.

Thisallowsuserstodirectlyuse

thelinkswithouthavingto

understandthedetailedlinkAPI.

TheMcFWAPIisplatform

independentandsameAPIwill

workonDM816x,DM814x,

DM810x

McFW

User

Application

HOSTA8

TypicallyGUIandother

applicationspecificcomponents

likefileread/write,network

streaming.

Customerspecific



2、基于Rdk框架的实例


Capture (YUV422I) 16CH D1 60fps
|
NSF (YUV420SP)
|
dup1---->IPCM3OUT(VPS) -> IPCM3IN(VID) -> ENC ->IPC_BITS_OUT_M3 ->IPC_BITS_IN_A8 -> fwrite() - Write to filesystem
|

|
+-<----IPCM3IN(VPS) <- IPCM3OUT(VID) -> DEC <-IPC_BITS_IN_M3<-IPC_BITS_OUT_A8 <-fread() - read from harddisk
|
MERGE
|
DUP2
|||
+--------+|+------------+
| | |
| | |
SW Mosaic SW Mosaic SW Moasic
(DEIH YUV422I) (DEI YUV422I) (SC5 YUV422I)
| | |
GRPX0 | GRPX1,2 | |
| | | | |
On-Chip HDMI Off-Chip HDMI SDTV (NTSC)
1080p60 1080p60 480i60

3、Link Api机制

3.1 link api的概念

link在上图中的视频数据流中是最基本的单元模块,每个link中包含了一个基于BIOS6/Linux的任务、线程、消息盒(使用操作系统的信号量实现)。由于每个link运行一个独立的线程,因此link之间可以并行运行。消息盒是关联用户指定的link,让link之间有个互相对话的机制,用来传递信令。而对于视频流数据、帧数据的传递link实现了专门的接口来实现,只传递指针,而不是数据。

在实现上节所介绍的数据流可以通过将多个link连接来实现chain,link API允许用户Create、Start、Stop、Delete、Control各个link。在Rdk中TI基于link API进行再次封装,用于特定的应用场合,其各种参数均是为特定的产品定制,可以是相关业务的开发更迅速。


3.2 link内部结构

Netra基于Rdk平台的软件框架设计
Netra(DM8168)处理器是个多核处理器,每个核之间相互独立却又相互关联,如何高效简洁地利用每个核完成一套系统功能是非常关键的,RDK这...

3.3 link的特性

  • 视频处理的工作量可以均衡到每个核心上去执行,如下表:
Processor OS Usedfor
HOSTA8 Linux Systemsetupandcontrol,GUI,IOperipheralcontrollikeSATA,Ethernet,USB,Audio
VPSSM3 BIOS6

HDVPSScontrolforvideocapture,videodisplay,scaling,deInterlacing…

VideoM3 BIOS6 HDVICP2Videocompression/decompression(H264encode,H264decode)
DSP BIOS6 SWOSD,customvideoprocessingalgorithms

  • 每个link都有自己独立的任务/线程用于完成视频采集或播放等处理;
  • 每个link都可以处理来自多个通道的视频帧数据,每个通道的视频宽高和数据格式都可以不同;
  • A8作为HOST可以用来连接多个link形成数据流的链并对其进行控制
  • 数据链被建立并启动时,数据链中的每个link将和它的下游link进行帧数据的交互
  • links之间的帧数据交互可以在多个核心之间进行,并且并不需要A8 HOST的干涉,从而降低A8的开销;
  • 在数据链运行过程中用户可以发送控制信令给任意link来动态设置相关的link参数

3.4 link接口

link接口可以分成以下几类:

  • link API——被用户调用来配置和控制link的接口
  • Inter link API——被其他links调用来交换帧数据的接口
  • link output queue——被其他links通过Inter Link API接口实用的帧buffer队列

3.5 link间的消息传递

每个Link通过一个32位的该LinkId来识别ID4位标识了这个Link是在哪个核上运行,低24位标识了该Link的名称

Bits Description
[0..27] Link ID
[28..31] Processor ID on which this link runs
0:DSP
1:Video M3

2:VPSS M3

3:A8


每个LinkAPI都需要这个LinkID参数来发送消息,当用户发送消息到一个Link时,根据这ID函数内部判断这个消息是发给本地的Link还是远端核心的Link;如果是本地的直接调用BIOS/LINUXAPI函数,否则就通过Syslink模块的MessageQ发送这个消息到指定的核心,让对端的核心调用对应的函数处理。


3.6 link API

下面将通过表格的形式来看看link API的部分接口及相关功能:

API Description
System_linkCreate Createsalink——allocatesdriver,codec,memoryresources.
System_linkGetInfo Getinformationaboutalinklikenumberofchannels,propertiesofeachchannel.MUSTbecalledafterSystem_linkCreate()foralink
System_linkStart Startthelink——startsthedriverorcodec
System_linkControl Sendalinkspecificcontrolcommandwithoptionalarguments
System_linkStop Stopthelink——stopsthedriverorcodec
System_linkDelete Deletesalink——free’sdriver,codec,memoryresources


3.7 Inter link API

下面的表格介绍了在link内部实现的交换帧数据的API,对于用户来说,这部分API是不需要关心的:

API Description
System_GetLinkInfoCb Functiontoreturninformationaboutalinklikenumberofchannels,propertiesofeachchannel
System_LinkGetOutputFramesCb

Functiontoreturncapturedorgeneratedor

outputframestothecaller(anotherlink)

System_LinkPutEmptyFramesCb Functiontoreleaseconsumedframesbacktotheoriginallinkforreuse
System_LinkGetOutputBitBufsCb Functiontoreturngeneratedoroutputbitstreamframetothecaller(anotherlink)–ValidonlyforEncodeLink
System_LinkPutEmptyBitBufsCb Functiontoreleaseconsumedbitstreamframesbacktotheoriginallinkforreuse–ValidonlyforEncodeLink

在每个link中必须实现一些函数并在初始化时注册这些函数指针给link管理的核心模块,用于帧数据的获取、释放、dump相关状态等。

对于任一个link想从它的上游link获取帧数据都需要调用link管理核心函数System_getLinksFullFrames(),该函数内部会发送消息到对应的上游link,触发该link向管理模块注册的回调函数System_LinkGetOutputFramesCb()将帧数据传递给该link;

同样的,在当一个link想释放处理完毕的帧buffer给上游link时需要调用link管理核心函数System_putLinksEmptyFrames(),该函数内部会发送消息到对应的上游link,触发它注册的回调函数System_LinkPutEmptyFramesCb()将帧buffer回收,用于后续的数据处理;

建立chain时,你肯定还会关注一个信息,那就是上游link的相关参数如何传递给下游的link,从源程序仔细琢磨琢磨就可以看出来,和上面的处理类似,所有有下游link的link都会注册一个System_GetLinkInfoCb()的回调函数,在下游link的driver中会在创建driver时调用System_linkGetInfo()函数来获取上游link的相关参数。

通过上述的方法,对于一个link来说就不需要关心和它交互的是哪一个link,所有的寻址都通过linkID来自动查找,并且同一个link实现可以和不同的link交互,而不需要改变函数的实现。


3.8 Link Output Queues 的管理

一个Link可以有一个或多个输出队列用来存放采集到的或处理完毕的帧数据,每个Link的输出队列内存由自己分配;

大多数Links只有一个输出队列,但是有些link有多个,从而可以实现多路不同的输出数据流满足不同的应用需求,例如,NoisefilterLink可以输出16路帧数据到2个输出队列,每个输出队列输出8路通道数据跟别给2DEILinks模块处理。

一个输出队列中可以有多个视频channels的数据,每个channel可以有不同的大小和数据格式;

数据结构FVID2_Frame是在VPSS驱动中定义的,Links之间就通过该结构参数传递帧数据的信息,如帧数据的Buf指针,而帧数据本身并不会被拷贝,从而节省内存开销;

当一个Link采集完或处理完一帧数据后会发送一个消息“SYSTEM_CMD_NEW_DATA”给下游的Link,从而通知它有数据可取;当下游Link收到该消息后会调用System_getLinksFullFrames()函数来获取对用的帧数据,处理完后再调用System_putLinksEmptyFrames()函数来归还给上游Link继续使用。

因此一个Link需要知道:

  • 上游LinkLinkIDQueID,从而从该队列里面获取帧数据
  • 下游LinkID,从而在有新数据产生时通知下游Link来取
上游LinkLinkIDQueID以及下游LinkID都是在System_linkCreate()时由A8 HOST端来指定的。


3.9 IPC link核间帧数据交互

IPCLink,是用来多核之间的帧数据传递的。

VPSS上的采集Link想把帧数据发送给VideoLink处理,先将帧数据传递给本地的IPCLink,然后IPCLink再通过Syslink/IPC发送到VideoLink上的IPCLink,然后再转发给VideoLink,这样的话对于采集Link的实现来说就非常清晰简单,它的实现都是发送给本地的另一个Link

IPCLink的实现有点复杂,因为它涉及的帧数据传递是在多个核之间,这里面就牵扯到cache的一致性问题,考虑到每个核的特性以及高效性,总共设计了3个内部Links用于帧数据的传递机制:

  • Intra-processorlinks

即同一核心内部的link,如采集与降噪之间的帧数据传递,这种内部的link间传递帧数据都是在VPSSM3内部完成,因此采用简单且高效的队列机制实现。

  • InterM3(Video/VPSS)links

M3内部核心之间的link,由于VideoVpss所在的2M3核心是同属于一个双核M3处理器,它们的cache是共享的;如降噪模块(VPSSNF)到编码模块(VIDEOEnc)之间传递帧数据,带有NotifyIPCListMP机制被用来在这2M3核心之间传递帧信息(FVID2_Frame),该过程中不需要任何cache操作和地址转换。

  • Interprocessor(M3toA8orDSP)

即处理器内部核心之间,如编码(VideoM3)到BitStreamIn(HostA8)之间传递帧数据,同样使用带NotifyIPCListMP机制2个核心之间传递帧信息(FVID2_Frame),但该过程中需要做cache同步和地址转换操作。


4、chain数据链路的建立

一个Chain是由多个links按照一定的应用需求按顺序连接成一条视频处理的数据流。

一个Chain可以销毁后重新按照新的需求组成新的Chain,不需要重启系统。

Chain创建是特别需要相关link的顺序

  • 通过System_linkCreate()函数按照由source>>sink的顺序创建需要的Links,SourceLink即没有上游LinkLink,如:视频采集;SinkLink是没有下游LinkLink,如:视频播放;这个创建顺序是非常重要的,因为一个Link创建时它会查询上游Link的一些信息,如上游Link需要的channel的个数和属性,从而按照这些参数配置自己。
  • 下一步调用System_linkStart()函数启动每个Link,启动顺序一般从SinkLink往前到SorceLink,当然你也可以不按照这个顺序,不过不推荐,因为这样可以保证每个Link在它的上游Link启动前准备好接收数据,避免过多的缓冲引入额外的时延。
  • 当一个Chain运行后控制命令就可以发送到各个Links来控制它,如调用System_linkControl()函数发送改变画面合成风格的命令给相应的Link,具体的命令定义由每个Link的功能实现来决定;
  • 注意:一般来说System_linkControl()函数是在System_linkCreate()创建了Link之后才能调用,不过有些控制命令可以在System_linkCreate()调用之前调用,以完成Link创建之前必须的一些初始化,如复位;
  • Chain工作完成或销毁时可以调用System_linkStop()函数先停止每个Link,注意:停止的顺序必须从Source开始依次到Sink结束;因为一个Link可能阻塞着等待下游Link释放当前Link的输出Buffer,如果下游Link先停止的话当前Link可能会出于waitforever的状态而永久退不出来,因此上游Link必须先停止,之后才能停止下游Link
  • 最后等所有Link全部停止后,可以调用System_linkDelete()函数删除所有Links,删除顺序没有要求;
  • Chain销毁后就可以按照之前的顺序重新创建一个新的Chain来完成另一个工作了。