跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化

本节主要介绍的是《跟Xilinx SAE 学HLS系列视频讲座》第20,21,22节。
跟Xilinx SAE 学HLS系列视频讲座笔记(1)
跟Xilinx SAE 学HLS系列视频讲座笔记(2)—— 编写高效的C Test Bench
跟Xilinx SAE 学HLS系列视频讲座笔记(3)—— 接口综合
跟Xilinx SAE 学HLS系列视频讲座笔记(4)—— For循环优化
跟Xilinx SAE 学HLS系列视频讲座笔记(5)—— 数组优化
跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化

1. 函数层面的优化
从函数这个角度来说代码风格,主要是看参数的数据类型,C++中的数据类型是以8为边界的,而实际硬件中我们可能会遇到任意精度的数据类型,因此我们一定在C++中定义为任意精度的数据类型;
跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
2. Inline
对函数的Inline实际是去除函数的层次化,带来的好处是可以改善资源,不再需要调用函数的相关逻辑,对于小函数HLS会自动Inline,如果我们不希望,可以通过directive中的 -off这个选型来实现
跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
3. ALLOCATION
定义了函数与相应RTL model之间的关系,ALLOCATION使副本并行运行,从而减少延迟性,配置与结果如下图所示,allocation的影响,它实际上是在Latency和Area上做折衷。
跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
4. Task Level Pipelining: Dataflow

  • 实际上是做并行处理,可以看到用到了channel,channel可以是ping-pong RAM,也可以是FIFO;
  • Dataflow可以作用于一些顺序处理的任务,比如函数或者循环,或者两者都有;
  • Dataflow是将顺序处理变为并行处理,使得当前任务不需要前面的任务结束才执行,可以并行处理,所以Dataflow允许任务之间有交叠,提高了数据吞吐量,降低了Latency;
    跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
    跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
    跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
    跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化
    5. 总结

跟Xilinx SAE 学HLS系列视频讲座笔记(6)—— 函数优化