CUDA 常见问题解答

nvprof 报告 “没有内核被分析”

在使用 nvprof 工具对 CUDA 目标的 Numba jitted 代码进行性能分析时,输出中包含 No kernels were profiled ,但显然存在正在运行的内核,这是怎么回事?

这很可能是由于在程序退出时没有刷新分析数据,详情请参阅 NVIDIA CUDA 文档 。要解决这个问题,只需在程序的退出点之前(或你想要停止分析的任何地方)添加对 numba.cuda.profile_stop() 的调用。有关 Numba 中 CUDA 分析支持的更多信息,请参阅 性能分析