您的位置: 首页 > 文章 > NVIDIA CUDA初级教程视频--(十) NVIDIA CUDA初级教程视频--(十) 分类: 文章 • 2023-12-10 15:44:40 ** 第十章CUDA程序基本优化 ** 1.有效的数据并行算法+针对GPU架构特性的优化=最优性能 2.并行规约parallel reduction:把不相关的计算放到不同的线程 3.warp分割:块内线程如何划分warp,通晓warp分割有助于:减少 分支发散,让warp尽早完工。