NVidia CUDA:Tesla T10 处理器和 Tesla M2090 处理器之间的区别
我有一个执行有限差分计算的 CUDA 代码。该代码在 Tesla M2090 处理器上运行良好,没有错误。相同的代码会在 Tesla T10 处理器中导致大量错误。我的结果中有很多零。
有谁知道这两种架构之间的区别以及如何解决问题的解决方案
I have a CUDA code that performs finite difference computation. The code works well on Tesla M2090 processors with no error. The same code results in lots of error in Tesla T10 processor. I am getting lots of zeros in my results.
Do anyone know the difference between these two architecture and solution to how to solve the problem
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Tesla C1060(基于 Tesla T10)计算能力 1.3
Tesla M2090 是更新的架构,基于 Fermi(2.0 或 2.1)
可能有两个问题:
您是否为 2.0 或 2.1 架构重新编译源代码?如果您针对 1.3 架构进行编译,则它不适用于 >=2.0。
CUDA 编程指南 3.1.2 二进制兼容性:
此外,费米的行为略有不同。一些不安全的代码可能在旧架构上正常工作,而在 Fermi 上它会捕获错误。如果您对此怀疑,可以查看“Fermi 兼容性指南”(随 CUDA 工具包提供),从程序员的角度了解架构之间的主要差异。
Tesla C1060 (based on Tesla T10) is of Compute Capability 1.3
Tesla M2090 is much newer architecture, based on Fermi (2.0 or 2.1)
There may be two issues:
Do you recompile your source for 2.0 or 2.1 architecture? If you compile for 1.3 architecture, it will not work for >=2.0.
CUDA Programming Guide 3.1.2 Binary Compatibility:
Also, Fermi behaves slightly differently. Some unsafe code might work correctly on old architectures, while on Fermi it catches the bug. If you suspect that, you can check the "Fermi Compatibility Guide" (available with the CUDA toolkit) to learn about the major differences between the architectures from the programmer's point of view.