关于Cuda 4.0和统一内存模型的问题

发布于 2024-10-19 11:29:45 字数 154 浏览 5 评论 0原文

Nvidia 似乎在宣扬 Cuda 4.0 允许程序员在 CPU 和 GPU 之间使用统一的内存模型。这不会取代在 GPU 和 CPU 中手动管理内存以获得最佳性能的需要，但它是否会允许更简单的实现，可以进行测试、验证，然后进行优化（手动管理 GPU 和 CPU 内存）？我想听听评论或意见:)

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

稳稳的幸福 2024-10-26 11:29:45

据我了解，重要的区别是，如果您有 2 个或更多 GPU，您将能够将内存从 GPU1 传输到 GPU2，而无需接触主机 RAM。您还可以在主机上仅用一个线程来控制 2 个 GPU。

回复收藏 0 原文

萌酱 2024-10-26 11:29:45

嗯，这似乎是一个大新闻！由 NVIDIA 自己的工程师构建的 thrust 库已经给您带来了一些感受。您只需通过 = 符号即可将数据从 RAM 移动到 GPU 的 DRAM（无需调用 cudaMalloc 和 cudaMemcpy 之类的东西）。因此推力使 CUDA-C 更像“只是 C”。

也许他们将来会将其集成到 CUDA-API 中。请注意，在反面，过程将是相同的（并将永远保持相同），但为了方便程序员而隐藏。（我不喜欢这样）

编辑：CUDA 4.0 已经发布，thrust 将与其集成。

回复收藏 0 原文

就此别过 2024-10-26 11:29:45

“统一”内存仅指地址空间。主机和设备指针是从相同的 64 位地址空间分配的，因此任何给定的指针范围在整个进程中都是唯一的。因此，CUDA 可以从指针推断出指针范围“属于”哪个设备。

重要的是不要将地址空间与读/写这些指针范围的能力混淆。 CPU 将无法取消引用设备内存指针。我相信，在支持统一地址的平台上，默认情况下所有主机分配都会被映射，因此 GPU 将能够取消引用主机分配。

注意：Windows Vista/Windows 7 上的默认驱动程序模型不支持此功能。

回复收藏 0 原文

~没有更多了~

关于作者

乙白

暂无简介

0 文章

0 评论

25 人气

关注发私信

友情链接

文江博客

关于Cuda 4.0和统一内存模型的问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

关于Cuda 4.0和统一内存模型的问题

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。