当前位置：文江博客话题详情

CUDA 设备如何处理立即操作数？

发布于 2024-08-30 02:38:24 字数 189 浏览 2 评论 0原文

使用立即数（整数）操作数编译 CUDA 代码，它们是保存在指令流中，还是放入内存中？具体来说，我正在考虑 24 位或 32 位无符号整数操作数。

到目前为止，我在我检查过的任何 CUDA 文档中都无法找到有关此问题的信息。因此，对像这样的特定 uarch 细节的任何文档的引用都是完美的，因为我目前没有关于 CUDA 在这个级别如何工作的良好模型。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

柠檬心 2024-09-06 02:38:24

NVIDIA 没有发布任何有关该级别设备如何工作的信息。有一个叫decuda的工具可以反编译cubins，这样就可以看到机器码了。如果我记得的话，立即数进入指令流，至少就 decuda 能够推断的而言。 decuda 的问题是它仅适用于 CUDA 2.3 或更低版本。他们在CUDA 3.0中将可执行格式更改为elf，而decuda已经很长时间没有维护了。

最好的官方文档是 PTX 文档，但该文件记录的是虚拟机isa，而不是真实设备。

回复收藏 0 原文