Nsight Compute 使用
记录使用Nsight Compute 分析CUDA程序性能的步骤。
1.单击菜单栏上的Connet,弹出如下界面,设置要剖析的执行程序路径等运行相关参数;选择Interactive Profile模式,可以对剖析流程进行控制;所有参数设置完成后,单击Launch开始性能分析。
2.在API Stream页面控制剖析软件执行到目标核函数,然后单击菜单栏的 Profile Kernel对核函数进行剖析
3.生成性能分析结果,在结果页面可以通过切换Page选项查看重点关注的参数,如Source ,Detail等
Detail信息:展示核函数整体执行的一些性能指标
Source信息:展示源码中每行代码及汇编指令执行使用资源情况