当前位置：文江博客话题详情

我实际上可以在cuda卡上分配多少内存

发布于 2024-12-08 13:29:54 字数 265 浏览 0 评论 0原文

我正在编写一个使用 cuda 在 GPU 上执行计算的服务器进程。我想对传入请求进行排队，直到设备上有足够的内存来运行作业，但我很难计算出可以在设备上分配多少内存。我对作业需要多少内存有一个很好的估计（至少从 cudaMalloc() 分配多少内存），但在我分配可用的全局内存总量之前，我就已经发现设备内存不足了。

是否有一些公式可以根据全局内存总量计算我可以分配的数量？我可以使用它，直到我得到一个可以凭经验工作的估计，但我担心我的客户会在某个时候部署不同的卡，而我的偷工减料的数字不会很好地工作。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

别理我 2024-12-15 13:29:54

GPU DRAM 的大小是您可以通过 cudaMalloc 分配的内存量的上限，但不能保证 CUDA 运行时可以在一次大分配中满足对所有内存的请求，甚至一系列小额分配。

内存分配的约束根据操作系统底层驱动程序模型的细节而变化。例如，如果相关 GPU 是主显示设备，则操作系统可能还为图形保留了部分 GPU 内存。运行时使用的其他隐式状态（例如堆）也会消耗内存资源。内存也可能已变得碎片化，并且不存在足够大的连续块来满足请求。

CUDART API 函数 cudaMemGetInfo 报告可用内存的空闲量和总量。据我所知，没有类似的 API 调用可以报告最大可满足分配请求的大小。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

519 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文