当前位置：文江博客话题详情

如何在 cuda 中管理大型 2D FFT

发布于 2024-11-07 14:05:16 字数 281 浏览 3 评论 0原文

我已经成功编写了一些 CUDA FFT 代码，可以对图像进行 2D 卷积，以及一些其他计算。

我如何弄清楚我可以运行的最大 FFT 是多少？ 2D R2C 卷积的计划似乎需要 2 倍的图像大小，以及 C2R 的另外 2 倍的图像大小。这看起来开销很大！

另外，似乎大多数基准测试都是针对相对较小的 FFT 的……这是为什么？似乎对于大图像，我很快就会耗尽内存。这通常是如何处理的？您能否对图像的图块执行 FFT 卷积并组合这些结果，并期望它与我对整个图像运行 2D FFT 相同？

感谢您回答这些问题

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

吹泡泡o 2024-11-14 14:05:16

CUFFT 根据您的图像大小计划不同的算法。如果您无法适应共享内存并且不是 2 的幂，那么 CUFFT 会计划进行异位变换，而尺寸合适的较小图像将更适合该软件。

如果您打算对整个图像进行 FFT，并且需要了解您的 GPU 可以处理什么，我最好的答案是猜测并检查不同的图像大小，因为 CUFFT 规划很复杂。

请参阅文档：http://developer.download.nvidia.com/compute/cuda/ 1_1/CUFFT_Library_1.1.pdf

我同意 Mark 的观点，认为平铺图像是进行卷积的方法。由于卷积相当于只计算许多独立的积分，因此您可以简单地将域分解为其组成部分，独立计算这些部分，然后将它们缝合在一起。 FFT 卷积技巧只是降低了需要计算的积分的复杂性。

我希望你的 GPU 代码在所有情况下都应该比 matlab 的性能好很多，除非你做了一些奇怪的事情。

回复收藏 0 原文

岛歌少女 2024-11-14 14:05:16

对整个图像运行 FFT 通常是不切实际的。它不仅需要大量内存，而且图像的宽度和高度必须是 2 的幂，这对您的输入造成了不合理的限制。

将图像切割成图块是完全合理的。图块的大小将决定您能够实现的频率分辨率。您可能还想重叠瓷砖。

回复收藏 0 原文

~没有更多了~

关于作者

番薯

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

如何在 cuda 中管理大型 2D FFT

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

琉璃梦幻

qq_4zWU6L

话少情深

西西弗的石头怪

彻夜缠绵

千寻…

友情链接

如何在 cuda 中管理大型 2D FFT

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

琉璃梦幻

qq_4zWU6L

话少情深

西西弗的石头怪

彻夜缠绵

千寻…

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。