cuda GPU:术语澄清
在 GPU 的上下文中,有人可以澄清以下含义之间的区别:核心、线程处理器、流处理器、多处理器。
另外,如何知道 GTX570 GPU(计算能力 2.0)每个 SM 的活动块数限制?
此外,设备属性显示我的 GPU 中每个块的最大线程数为 1024,但 cuda 占用计算器不接受计算能力 2.0 gpu 的该值。 cuda占用计算器有新版本吗(2.1之后)?
In context of gpu, can someone clarify the difference of meanings between: core, threadprocessor, streamprocessor, multiprocessor.
Also, how to know the limit on active number of blocks per SM for GTX570 GPU (compute capability 2.0)?
Further, device properties show that maximum thread per block in my GPU is 1024, but cuda occupancy calculator does not accept that value for compute capability 2.0 gpu. Is there a new version of cuda occupancy calculator (after 2.1)?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
它们的关系如下:
GPU 由多个 SM(流式多处理器)组成。每个 GPU 的 SM 确切数量取决于您使用的 GPU(在低端卡上,只有 2 个 SM 可用,而高端卡则最多有 16 个)。
每个 SM 由多个核心(Fermi 之前的卡 (CC 1.x) 上有 8 个,Fermi 卡 (CC 2.x) 上有 32 个)核心组成。
我以前从未听说过“线程处理器”这个词。经过一番谷歌搜索后,它看起来只是“核心”的另一个词,这个词可能在早期版本的文档中使用过,但后来被替换了。
最大。每个 SM 的块数为 8(请参阅 Cuda 占用计算器,“GPU 数据”选项卡,“线程块/多处理器”行)
CUDA Occ。来自 http://developer.nvidia.com/nvidia-gpu-computing-documentation 对我来说效果很好。可能您正在使用旧的有缺陷的版本。
They realate as follows:
GPU conststs of several SMs (streaming multiprocessors). Exact number of SMs per GPU depends on what GPU are you using (on low-end cards, only 2 SMs are available, while highend ones have up to 16).
Each SM consists of several (8 on pre-Fermi cards (CC 1.x), 32 on Fermi cards (CC 2.x)) cores.
I have never heard the term "threadprocessor" before. After some googling, it looks like it's just another word for "core", likely this word was used in early versions of documentation, but then got replaced.
Max. number of blocks per SM is 8 (see Cuda Occupancy Calculator, tab "GPU data", row "Thread Blocks / Multiprocessor")
CUDA Occ. calculator from http://developer.nvidia.com/nvidia-gpu-computing-documentation works fine for me. May be you are using old bugged version.