当前位置：文江博客话题详情

Matlab cuda preprocessor

CUDA：使用预处理变量来指定问题大小的原因

发布于 2024-11-18 22:03:02 字数 386 浏览 4 评论 0原文

我正在 Matlab mex-Files 中编码 CUDA。当您查看互联网上的 CUDA 示例甚至 nvidia 手册时，您经常会看到使用预处理变量来指定问题大小，例如向量加法的向量长度或类似的内容。我也这样编写程序：用于指定问题大小的预处理变量。我必须承认：我喜欢它，因为您可以在代码中的任何地方访问这些内容，例如作为循环中的限制或类似的东西，而不必通过参数显式地将它们传递给函数。

但我遇到了以下问题：我想针对几个不同的问题大小对程序进行测试，因此我每次都需要通过将预处理变量传递给编译器来再次编译代码。这不是问题，我已经编写了基准测试并且它可以工作。但事后我只是想知道为什么我选择这个版本而不是简单地通过运行时的用户输入来指定它。因此，我正在寻找人们可能想要使用预处理变量而不是简单地将问题大小传递给程序的原因。

谢谢！

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

王权女流氓 2024-11-25 22:03:02

当您在内核中编译问题大小常量时，编译器可以进行某些类型的优化，而如果大小仅在运行时已知，则编译器无法进行此类优化。完整循环展开就是一个明显的例子。

在其他情况下，例如共享内存数组大小，如果将大小编译进去会更清楚；否则，您必须在内核启动时传入总共享内存大小，并将该内存分解为您需要的共享数组数量。这工作得很好，但是如果您只需要静态声明（需要编译时大小），代码会更清晰。

回复收藏 0 原文

故笙诉离歌 2024-11-25 22:03:02

主要原因是，一般来说，问题的规模与 GPU 架构密切相关，例如每个块的线程数、块数、每个线程的共享内存量、每个线程的寄存器数等。一般来说，这些数字是所有这些都经过精心手工调整，以获得可用资源的最大利用，并且您无法轻松地动态更改问题大小，同时仍保持最佳性能。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

饮湿

文章 0 评论 0

明月

文章 0 评论 0

02

文章 0 评论 0

hs1283

文章 0 评论 0

风向决定发型

文章 0 评论 0

落花浅忆

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文