当前位置：文江博客话题详情

CUDA 与 Direct X 10 的并行数学比较。你对此有什么想法吗？

发布于 2024-07-14 21:51:17 字数 46 浏览 5 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

别靠近我心 2024-07-21 21:51:17

如果您知道您的目标架构正在使用 nVidia 芯片，那么 CUDA 可能是更好的选择。您可以完全控制数据传输、指令路径和操作顺序。当您在较低级别工作时，您还可以减少 __syncthreads 调用。

我认为 DirectX 10 会更容易交互，但如果你真的想推动速度优化，你必须绕过额外的层。 DirectX 10 也不知道何时使用纹理内存、恒定内存和共享内存，具体取决于您的特定算法。

如果您可以使用 Tesla C1060 或类似设备，那么 CUDA 无疑是更好的选择。如果您了解 GPGPU 的具体情况，您确实可以加快速度 - 我已经看到 Tesla 上的一种特定算法与我的台式机上的速度提高了 188 倍。

回复收藏 0 原文

终弃我 2024-07-21 21:51:17

我觉得CUDA很尴尬。它不是 C，而是它的一个子集。它本身不支持双精度浮点并且是模拟的。对于单精度来说还是可以的。这取决于您投入的任务类型。您必须花费更多的时间进行并行计算，而不是传递数据，这样数据才值得使用。但这个问题并不是 CUDA 所独有的。

我会等待 Apple 的 OpenCL，它似乎将成为并行计算的行业标准。

回复收藏 0 原文

你好，陌生人 2024-07-21 21:51:17

嗯，CUDA 是可移植的...如果你问我的话，这是一个巨大的胜利...

回复收藏 0 原文

晨曦慕雪 2024-07-21 21:51:17

CUDA 与支持双精度浮点运算无关。
这取决于可用的硬件。 9、100、200和Tesla系列支持双精度浮点运算tesla。

回复收藏 0 原文

天气好吗我好吗 2024-07-21 21:51:17

在它们之间做出决定应该很容易。

如果您的应用程序可以容忍特定于 Windows，您仍然可以考虑 DirectX Compute。否则，请使用 CUDA 或 OpenCL。

如果您的应用程序无法容忍 NVIDIA 上的供应商锁定，则您无法使用 CUDA，而必须使用 OpenCL 或 DirectX Compute。

如果您的应用程序正在进行 DirectX 互操作，请考虑 CUDA/OpenCL 将在执行图形 API 互操作时产生上下文切换开销，而 DirectX 计算不会。

除非这些标准中的一个或多个影响您的应用程序，否则请使用大规模并行工具链的鼻祖：CUDA。

回复收藏 0 原文

~没有更多了~

关于作者

诠释孤独

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

CUDA 与 Direct X 10 的并行数学比较。你对此有什么想法吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

CUDA 与 Direct X 10 的并行数学比较。 你对此有什么想法吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接

CUDA 与 Direct X 10 的并行数学比较。你对此有什么想法吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。