文章 0 浏览 2
我正在划分为多个 GPU 的块 (N*N/p) 上运行 CUFFT,我有一个关于计算性能的问题。首先,介绍一下我的做法: 将 N*N/p 块发送到每个 GPU 对 p 个 GPU …
我正在查看 Nvidia SDK 的卷积 FFT 示例(对于大内核),我知道傅立叶变换背后的理论及其 FFT 实现(至少是基础知识),但我无法弄清楚以下代码的作用…
文章 0 评论 0
接受