cuda GPU:术语澄清

发布于 2024-12-23 05:07:25 字数 202 浏览 1 评论 0原文

在 GPU 的上下文中,有人可以澄清以下含义之间的区别:核心、线程处理器、流处理器、多处理器。

另外,如何知道 GTX570 GPU(计算能力 2.0)每个 SM 的活动块数限制?

此外,设备属性显示我的 GPU 中每个块的最大线程数为 1024,但 cuda 占用计算器不接受计算能力 2.0 gpu 的该值。 cuda占用计算器有新版本吗(2.1之后)?

In context of gpu, can someone clarify the difference of meanings between: core, threadprocessor, streamprocessor, multiprocessor.

Also, how to know the limit on active number of blocks per SM for GTX570 GPU (compute capability 2.0)?

Further, device properties show that maximum thread per block in my GPU is 1024, but cuda occupancy calculator does not accept that value for compute capability 2.0 gpu. Is there a new version of cuda occupancy calculator (after 2.1)?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

深爱不及久伴 2024-12-30 05:07:25
  1. 它们的关系如下:
    GPU 由多个 SM(流式多处理器)组成。每个 GPU 的 SM 确切数量取决于您使用的 GPU(在低端卡上,只有 2 个 SM 可用,而高端卡则最多有 16 个)。
    每个 SM 由多个核心(Fermi 之前的卡 (CC 1.x) 上有 8 个,Fermi 卡 (CC 2.x) 上有 32 个)核心组成。
    我以前从未听说过“线程处理器”这个词。经过一番谷歌搜索后,它看起来只是“核心”的另一个词,这个词可能在早期版本的文档中使用过,但后来被替换了。

  2. 最大。每个 SM 的块数为 8(请参阅 Cuda 占用计算器,“GPU 数据”选项卡,“线程块/多处理器”行)

  3. CUDA Occ。来自 http://developer.nvidia.com/nvidia-gpu-computing-documentation 对我来说效果很好。可能您正在使用旧的有缺陷的版本。

  1. They realate as follows:
    GPU conststs of several SMs (streaming multiprocessors). Exact number of SMs per GPU depends on what GPU are you using (on low-end cards, only 2 SMs are available, while highend ones have up to 16).
    Each SM consists of several (8 on pre-Fermi cards (CC 1.x), 32 on Fermi cards (CC 2.x)) cores.
    I have never heard the term "threadprocessor" before. After some googling, it looks like it's just another word for "core", likely this word was used in early versions of documentation, but then got replaced.

  2. Max. number of blocks per SM is 8 (see Cuda Occupancy Calculator, tab "GPU data", row "Thread Blocks / Multiprocessor")

  3. CUDA Occ. calculator from http://developer.nvidia.com/nvidia-gpu-computing-documentation works fine for me. May be you are using old bugged version.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文