定时并行CUDA内核

问题描述:

不幸的是,基于费米的GPU将在并行Nsight中对任何内核时序进行跟踪,即使它们是不同流中的并发内核。定时并行CUDA内核

任何人都可以提出如何使用定时器手动显示内核在不同流中的并发性。

干杯 埃德

与Nsight剖析当前确实禁用并行内核,因此要获得准确的计时,您需要使用事件追踪时机。

您可以像预期的那样使用事件,并且可以使用cudaStreamWaitEvent()使流等待另一个流中的事件。有关更多信息,请参见CUDA Reference Manual第4.5.2.5节。