CUDA 常见问题解答
nvprof 报告 “没有内核被分析”
在使用 nvprof
工具对 CUDA 目标的 Numba jitted 代码进行性能分析时,输出中包含 No kernels were profiled
,但显然存在正在运行的内核,这是怎么回事?
这很可能是由于在程序退出时没有刷新分析数据,详情请参阅 NVIDIA CUDA 文档 。要解决这个问题,只需在程序的退出点之前(或你想要停止分析的任何地方)添加对 numba.cuda.profile_stop()
的调用。有关 Numba 中 CUDA 分析支持的更多信息,请参阅 性能分析。