GPU 中的活动扭曲数量 (Fermi)

发布于 2024-11-24 04:18:58 字数 141 浏览 2 评论 0原文

我有一个关于 GPU 中的活动扭曲的快速问题（我更愿意在费米中知道它）。对于特定的内核，SM中任何周期的活动warp数量在内核的整个执行时间内是否相同？正如我所试验的，活动扭曲总数（对于整个执行）和程序内核中的同步数量之间存在一些相关性。谁能澄清这个关系？谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

牵你手 2024-12-01 04:18:58

活动扭曲的数量可能会随着时间的推移而变化，因为：

其他线程块可以在同一个 SM 上完成或开始，因此，如果每个线程块有四个扭曲，那么如果 SM 上只有一个线程块驻留，则最多会有四个扭曲，但是两个或三个线程块，您最多可以有八个或十二个线程块。
如果一个 warp 到达了代码的末尾，那么它将不再执行代码（自然）。

整个程序执行的活动 warp 计数将取决于许多因素，但请记住，它是按活动 warp 的数量递增的。每个周期。这意味着如果增加同步数量，这也会增加每个 warp 执行内核所需的周期数，那么您会期望更高的活动 warp 计数。

另请注意，分析器中的一些派生统计数据是近似值，因为它们通常使用来自多次运行的值，因此可能存在一些可变性。

回复收藏 0 原文

朮生 2024-12-01 04:18:58

本文解释了barrier同步和wrap之间的关系，
通过微基准测试揭秘 GPU 微架构。

回复收藏 0 原文

~没有更多了~

关于作者

挽清梦

暂无简介

文章

598 人气

关注发私信

友情链接

文江博客

GPU 中的活动扭曲数量 (Fermi)

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

GPU 中的活动扭曲数量 (Fermi)

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。