cuda visual-studio-2010 c parallel-processing

在 device/global CUDA 内核中动态分配内存

发布于 2024-11-28 08:28:35 字数 606 浏览 0 评论 0原文

根据 CUDA 编程指南，第 122 页，只要我们使用计算架构 2.x，就可以在 device/global 函数内动态分配内存。

我的问题是，当我尝试执行此操作时，我收到命令行消息：

命令“某些命令” -gencode=arch=compute_10,code=\"sm_10,compute_10\" -gencode=arch=compute_20,code=\"sm_20,compute_20\" 等...

后面跟着一个错误，指出您不能从设备/全局函数调用主机函数 (malloc)。

上面的消息显示它正在尝试在compute 1.x 下进行编译。我正在使用 VS2010 并在“CUDA C/C++”属性页中将“代码生成”设置为“compute_20,sm_20”，所以我不确定为什么它仍然尝试在计算 1.x 下进行编译。我肯定使用的是支持 2.x 的卡。有什么想法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

烟沫凡尘 2024-12-05 08:28:35

您应该能够在输出中看到 nvcc 命令行。事实上，我认为你粘贴了所有 -gencode/etc 的内容。其中是您的命令行。因此，这也证明您正在编译 sm_10 和 sm_20 的代码，这就是为什么您在调用 malloc 时收到错误的原因。

您可以通过使用 #if __CUDA_ARCH__ >= 200 包装对 malloc 的调用进行确认，并查看错误是否消失。

我猜测您在项目中 .cu 文件的默认属性中设置了要编译 sm_20 的属性，但是在您将 .cu 文件添加到项目中。将文件添加到项目时，默认值可能设置为 sm_10 和 sm_20（这是 .rules 文件的默认值）。如果右键单击文件本身，您可能会看到 sm_20 被选中。只是一种预感。

回复收藏 0 原文

~没有更多了~

关于作者

情丝乱

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

在 device/global CUDA 内核中动态分配内存

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

在 __device/global__ CUDA 内核中动态分配内存

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

離殇

小姐丶请自重

Aik

国产ˉ祖宗

猥琐帝

半仙

友情链接

在 device/global CUDA 内核中动态分配内存

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。