定时并行CUDA内核
问题描述:
答
与Nsight剖析当前确实禁用并行内核,因此要获得准确的计时,您需要使用事件追踪时机。
您可以像预期的那样使用事件,并且可以使用cudaStreamWaitEvent()
使流等待另一个流中的事件。有关更多信息,请参见CUDA Reference Manual第4.5.2.5节。