ptx

ptx

文章 0 浏览 5

负载和存储操作是否在共享内存原子中?

我试图弄清楚原始类型上的负载和存储操作是否是原子,当我们从CUDA中的共享存储器加载/存储时。 一方面,似乎将任何负载/存储都编译到PTX指令 ld.weak…

故笙诉离歌 2025-02-06 08:48:38 3 0

为什么带有cuda10.1的Pytorch 1.7无法兼容Nvidia A100 Ampere架构(根据PTX兼容性原则)

根据 Nvidia 官方文档,如果 CUDA 应用程序构建为包括 PTX,因为 PTX 是向前兼容的,这意味着支持 PTX 在计算能力高于生成该 PTX 时假定的计算能力的…

×眷恋的温暖 2025-01-11 18:31:06 4 0

我应该研究 PTX 来优化我的内核吗?如果是这样,怎么办?

您是否建议阅读内核的 PTX 代码以进一步优化内核? 一个例子:我读到,可以从 PTX 代码中找出自动循环展开是否有效。如果不是这种情况,则必须在内核…

我最亲爱的 2024-12-14 10:57:30 7 0

如何获取要执行的 PTX 文件

我知道如何从 .cu 生成 .ptx 文件以及如何从 .ptx 生成 .cubin 文件。 但我不知道如何获得最终的可执行文件。 更具体地说,我有一个 sample.cu 文件,…

拥抱我好吗 2024-10-14 06:01:06 12 0

我可以将特定数据预取到 CUDA 内核中的特定缓存级别吗?

据我所知,Fermi GPU 支持预取 L1 或 L2 缓存。然而,在CUDA参考手册中我找不到任何相关内容。 CUDA 允许我的内核代码将特定数据预取到特定级别的缓存…

明媚殇 2024-10-13 00:28:12 14 0

是否可以将汇编指令放入 CUDA 代码中?

我想在 CUDA C 代码中使用汇编代码 为了减少昂贵的执行 就像我们在 C 编程中使用 asm 一样。 是否可以?…

掌心的温暖 2024-09-18 06:14:33 14 0
更多

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文