当前位置：文江博客话题详情

Fermi 架构上的 int2 与 int4 负载

发布于 2024-11-08 01:50:33 字数 64 浏览 0 评论 0 原文

如果需要将两个 int2 从设备内存加载到寄存器，那么两次连续加载 int2 与一次加载 int4 相比会差多少？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

霞映澄塘 2024-11-15 01:50:33

这取决于 GPU 和内存访问模式。但是，假设（由于问题中缺乏信息）在计算能力 2.0+ GPU（Fermi GPU）上进行顺序寻址，请参阅 GTC 2010 中 Paulius Micikevicius 的演示文稿。

该幻灯片显示，对于较低的多处理器占用率（每个多处理器的活动线程数较低），int4 可以发挥很大作用超过 int2。对于高入住率来说，差别不大。

然而，正如幻灯片所指出的，“几个独立的较小访问具有相同的效果
作为一个更大的。例如： 4 个 32 位 ~= 1 个 128 位”。因此，如果您需要加载的两个 int2 值是独立的，只需在代码中依次发出两个加载，它应该与执行几乎相同的性能一个 int4，假设如上所述的一致内存访问。

回复收藏 0 原文

~没有更多了~

关于作者

瘫痪情歌

暂无简介

0 文章

0 评论

23 人气

关注发私信

留蓝

文章 0 评论 0

关注

18790681156

文章 0 评论 0

关注

zach7772

文章 0 评论 0

关注

Wini

文章 0 评论 0

关注

ayeshaaroy

文章 0 评论 0

关注

初雪

文章 0 评论 0

友情链接

文江博客

Fermi 架构上的 int2 与 int4 负载

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

Fermi 架构上的 int2 与 int4 负载

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。