2D/3D CUDA 块如何划分为扭曲？

发布于 2024-11-10 11:42:22 字数 160 浏览 7 评论 0原文

如果我从一个块具有尺寸的网格开始我的内核：

dim3 block_dims(16,16);

网格块现在如何分割成扭曲？这样一个块的前两行是否形成一个扭曲，或者前两列，或者这是任意排序的？

假设 GPU 计算能力为 2.0。

原文

If I start my kernel with a grid whose blocks have dimensions:

dim3 block_dims(16,16);

How are the grid blocks now split into warps? Do the first two rows of such a block form one warp, or the first two columns, or is this arbitrarily-ordered?

Assume a GPU Compute Capability of 2.0.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一腔孤↑勇 2024-11-17 11:42:22

线程在块内按顺序编号，以便 threadIdx.x 变化最快，然后 threadIdx.y 变化第二快，threadIdx.z变化最慢。这在功能上与多维数组中的列主要排序相同。扭曲是按此顺序从线程顺序构造的。因此 2d 块的计算为

unsigned int tid = threadIdx.x + threadIdx.y * blockDim.x;
unsigned int warpid = tid / warpSize;

这在编程指南和 PTX 指南中都有介绍。

Threads are numbered in order within blocks so that threadIdx.x varies the fastest, then threadIdx.y the second fastest varying, and threadIdx.z the slowest varying. This is functionally the same as column major ordering in multidimensional arrays. Warps are sequentially constructed from threads in this ordering. So the calculation for a 2d block is

unsigned int tid = threadIdx.x + threadIdx.y * blockDim.x;
unsigned int warpid = tid / warpSize;

This is covered both in the programming guide and the PTX guide.

回复收藏 0 原文

宣告ˉ结束 2024-11-17 11:42:22

为了通过两个连续扭曲的“Visual Studio WarpWatch”窗口说明 @talonmies 的答案（dim3 block_dims(16,16); 和 WarpSize = 32）：

回复收藏 0 原文

~没有更多了~

关于作者

万劫不复

暂无简介

文章

25 人气

关注发私信

友情链接

文江博客

2D/3D CUDA 块如何划分为扭曲？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

2D/3D CUDA 块如何划分为扭曲？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。