NVIDIA cuFFT LTO EA 预览文档(已弃用)

警告

cuFFT LTO EA预览版已弃用,将在不久的将来移除。

预览版的主要功能LTO回调已作为CUDA Toolkit 12.6 Update 2的一部分集成到cuFFT中。与cuFFT LTO EA预览版相比,此次更新带来了显著改进,包括允许为回调设备函数指定任意名称,以及性能提升。

如有任何问题,欢迎联系 Miguel Ferrer Avila <mferreravila@nvidia.com> 或 Lukasz Ligowski <lligowski@nvidia.com>。

欢迎使用cuFFT LTO EA预览版(支持链接时优化的cuFFT早期体验版本)。

在这里您可以找到:

  • 包含示例代码片段的快速入门指南。

  • 一个如何使用cuFFT LTO EA章节,其中解释了如何将LTO与此预览版cuFFT配合使用。

  • 一个API参考部分,描述了此cuFFT LTO EA API为cuFFT带来的扩展功能。

cuFFT LTO EA预览版可在NVIDIA cuFFT LTO EA Preview中找到。

亮点

  • 扩展回调API以支持LTO回调例程。

  • 使用回调功能无需离线设备绑定。

  • 为动态cuFFT库添加回调支持。

  • 为Windows添加回调支持。

  • 兼容现有的回调设备代码。

  • 在许多情况下,相比非LTO回调例程性能有所提升。

注意

与CUDA工具包中发布的cuFFT版本不同,cuFFT LTO EA预览版并非完整的生产级二进制文件。它旨在让用户能够在Linux和Windows系统上测试支持LTO的回调功能,并向我们提供反馈,以便在该功能正式集成到cuFFT生产版本前优化用户体验。虽然我们会尽力确保这些二进制文件的稳定性,但仍可能偶尔遇到错误。

如有任何反馈意见,请直接联系 Miguel Ferrer Avila <mferreravila@nvidia.com> 或 Lukasz Ligowski <lligowski@nvidia.com>。