NVidia CUDA:Tesla T10 处理器和 Tesla M2090 处理器之间的区别

发布于 2024-11-17 16:29:24 字数 135 浏览 4 评论 0原文

我有一个执行有限差分计算的 CUDA 代码。该代码在 Tesla M2090 处理器上运行良好,没有错误。相同的代码会在 Tesla T10 处理器中导致大量错误。我的结果中有很多零。

有谁知道这两种架构之间的区别以及如何解决问题的解决方案

I have a CUDA code that performs finite difference computation. The code works well on Tesla M2090 processors with no error. The same code results in lots of error in Tesla T10 processor. I am getting lots of zeros in my results.

Do anyone know the difference between these two architecture and solution to how to solve the problem

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

梦幻的味道 2024-11-24 16:29:24

Tesla C1060(基于 Tesla T10)计算能力 1.3
Tesla M2090 是更新的架构,基于 Fermi(2.0 或 2.1)
可能有两个问题:

您是否为 2.0 或 2.1 架构重新编译源代码?如果您针对 1.3 架构进行编译,则它不适用于 >=2.0。

CUDA 编程指南 3.1.2 二进制兼容性:

保证二进制兼容性
从一个小修改到下一个修改
一项,但不是来自一项小修改
到上一个或跨专业
修订。

此外,费米的行为略有不同。一些不安全的代码可能在旧架构上正常工作,而在 Fermi 上它会捕获错误。如果您对此怀疑,可以查看“Fermi 兼容性指南”(随 CUDA 工具包提供),从程序员的角度了解架构之间的主要差异。

Tesla C1060 (based on Tesla T10) is of Compute Capability 1.3
Tesla M2090 is much newer architecture, based on Fermi (2.0 or 2.1)
There may be two issues:

Do you recompile your source for 2.0 or 2.1 architecture? If you compile for 1.3 architecture, it will not work for >=2.0.

CUDA Programming Guide 3.1.2 Binary Compatibility:

Binary compatibility is guaranteed
from one minor revision to the next
one, but not from one minor revision
to the previous one or across major
revisions.

Also, Fermi behaves slightly differently. Some unsafe code might work correctly on old architectures, while on Fermi it catches the bug. If you suspect that, you can check the "Fermi Compatibility Guide" (available with the CUDA toolkit) to learn about the major differences between the architectures from the programmer's point of view.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文