释放 CUDA 内存非常慢

发布于 2024-08-19 08:56:42 字数 260 浏览 2 评论 0原文

我使用 cudaMalloc((void**)&(storage->data), size * sizeof(float)) 在 GPU 上分配一些浮点数组（相当大，即 9,000,000 个元素）。在程序结束时，我使用 cudaFree(storage->data); 释放该内存。

问题是第一次释放非常慢，大约需要 10 秒，而其他释放几乎是瞬时的。

我的问题如下：什么可能导致这种差异？ GPU 上的内存释放通常那么慢吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

匿名。 2024-08-26 08:56:42

正如 NVIDIA 论坛所指出的，几乎可以肯定，问题出在您计时的方式上，而不是 cudaFree 上。

回复收藏 0 原文

风情万种。 2024-08-26 08:56:42

应该不会那么慢，在带有 cuda 2.2 的 Linux 上，只需要不到一秒的时间。
您是否尝试过运行主机和设备分析器来确切了解速度慢的原因？
你执行了多少单独的分配？，这确实有一些惩罚，但不是那么大。

回复收藏 0 原文

~没有更多了~

关于作者

我ぃ本無心為│何有愛

暂无简介

0 文章

0 评论

22 人气

关注发私信

謌踐踏愛綪

文章 0 评论 0

关注

开始看清了

文章 0 评论 0

关注

高速公鹿

文章 0 评论 0

关注

alipaysp_PLnULTzf66

文章 0 评论 0

关注

热情消退

文章 0 评论 0

关注

白色月光

文章 0 评论 0

友情链接

文江博客

释放 CUDA 内存非常慢

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签