当前位置：文江博客话题详情

hardware cuda fpga

用于特殊用途 3D 图形计算的 CUDA 或 FPGA？

发布于 2024-07-08 18:22:33 字数 1449 浏览 12 评论 0 原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

残龙傲雪 2024-07-15 18:22:33

我不久前调查了同样的问题。在与从事 FPGA 工作的人交谈后，我得到以下结论：

FPGA 非常适合实时系统，即使 1ms 的延迟也可能太长。这不适用于您的情况；
FPGA 可以非常快，特别是对于明确定义的数字信号处理用途（例如雷达数据），但好的 FPGA 甚至比专业 GPGPU 更昂贵且更专业；
FPGA 的编程相当麻烦。由于需要编译硬件配置组件，因此可能需要几个小时。与软件开发人员相比，它似乎更适合电子工程师（通常是从事 FPGA 工作的工程师）。

如果您能让 CUDA 为您服务，那么它可能是目前最好的选择。它肯定比 FPGA 更灵活。

其他选择包括 ATI 的 Brook，但在大事发生之前，它根本没有像 CUDA 那样被广泛采用。之后，仍然有所有传统的 HPC 选项（x86/PowerPC/Cell 集群），但它们都相当昂贵。

希望有帮助。

回复收藏 0 原文

初心未许 2024-07-15 18:22:33

我们对 FPGA 和 CUDA 进行了一些比较。如果您能够真正以 SIMD 方式表述您的问题并且能够访问合并的内存，那么 CUDA 就会大放异彩。如果内存访问未合并 (1) 或者不同线程中有不同的控制流，则 GPU 的性能可能会大幅下降，而 FPGA 的性能可能会优于它。另一件事是，当你的业务规模很小，但你的业务量很大时。但是你不能（例如由于同步）不在一个内核中循环启动它，那么你对 GPU 内核的调用时间就会超过计算时间。

此外，FPGA 的性能可能会更好（取决于您的应用场景，即 GPU 仅在始终进行计算时才更便宜（以瓦特/浮点计算））。

当然，FPGA 也有一些缺点： IO 可能是其中之一（我们这里有一个应用程序，我们需要 70 GB/s，对于 GPU 来说没问题，但要将如此大量的数据输入 FPGA，传统设计需要比可用的引脚更多的引脚）。另一个缺点是时间和金钱。 FPGA 比最好的 GPU 贵得多，而且开发时间非常长。

(1) 不同线程同时访问内存必须是顺序地址。这有时确实很难实现。

回复收藏 0 原文

万劫不复 2024-07-15 18:22:33

我会选择 CUDA。
我从事图像处理工作，多年来一直在尝试硬件附加组件。首先我们有 i860，然后是 Transputer，然后是 DSP，然后是 FPGA 和直接编译到硬件。
不可避免地发生的事情是，当硬件板真正调试并可靠并且代码已移植到它们时 - 常规 CPU 已经先进以击败它们，或者主机架构发生了变化，我们无法使用旧板，或者董事会的制造者破产了。

通过坚持使用 CUDA 之类的东西，您就不再受制于一家小型 FPGA 板专业制造商。 GPU 的性能比 CPU 提升得更快，并且得到了游戏玩家的资助。它是一种主流技术，因此将来可能会与多核 CPU 合并，从而保护您的投资。

回复收藏 0 原文

天煞孤星 2024-07-15 18:22:33

FPGA

您需要什么：
- 学习 VHDL/Verilog（相信我，你不想学习）
- 购买测试硬件、综合工具许可证
- 如果您已经拥有基础架构并且只需开发核心
  - 开发设计（可能需要数年时间）
- 如果您不这样做：
  - DMA、硬件驱动程序、超昂贵的综合工具
  - 大量有关总线、内存映射、硬件综合的知识
  - 构建硬件，购买 IP 核
  - 开发设计
  - 未提及董事会开发
例如，带有 Xilinx ZynqUS+ 芯片的普通 FPGA PCIe 卡成本超过 3000 美元
FPGA 云的成本也高达 2 美元/小时以上
结果：
- 这至少需要运营公司的资源。

GPGPU (CUDA/OpenCL)

您已经有了要测试的硬件。
与 FPGA 相比：
- 一切都有详细记录。
- 一切都很便宜
- 一切正常
- 一切都很好地集成到编程语言
还有 GPU 云。
结果：
- 您只需下载 sdk 即可开始。

回复收藏 0 原文

断舍离 2024-07-15 18:22:33

显然这是一个复杂的问题。这个问题可能还包括细胞处理器。
对于其他相关问题，可能没有一个正确的答案。

根据我的经验，任何以抽象方式完成的实现，即编译的高级语言与机器级实现，都将不可避免地产生性能成本，特别是在复杂的算法实现中。对于任何类型的 FPGA 和处理器都是如此。专门为实现复杂算法而设计的 FPGA 比处理元件通用的 FPGA 性能更好，从而使其能够从输入控制寄存器、数据 I/O 等方面实现一定程度的可编程性。FPGA

性能更高的另一个常见示例是在级联流程中，一个流程的输出成为另一个流程的输入，并且它们不能同时完成。 FPGA 中的级联流程很简单，可以显着降低内存 I/O 要求，同时处理器内存将用于有效级联存在数据依赖性的两个或多个流程。

GPU 和 CPU 也是如此。在不考虑高速缓冲存储器或主存储器系统的固有性能特征的情况下开发的、在CPU上执行的用C实现的算法将不会像用C实现的算法那样执行。当然，不考虑这些性能特征可以简化实施。但以性能为代价。

虽然没有直接使用 GPU 的经验，但知道其固有的内存系统性能问题，它也会受到性能问题的影响。

回复收藏 0 原文

丘比特射中我 2024-07-15 18:22:33

这是 2008 年开始的老话题，但最好回顾一下自那时以来 FPGA 编程发生的事情：
1. FPGA 中的 C 到门是许多公司的主流开发方式，与 Verilog/SystemVerilog HDL 相比，可以节省大量时间。在C到gates中系统级设计是最难的部分。
2. FPGA 上的 OpenCL 已经存在 4 年多了，包括 Microsoft (Asure) 和 Amazon F1 (Ryft API) 的浮点和“云”部署。使用 OpenCL，系统设计相对容易，因为主机和计算设备之间定义了非常明确的内存模型和 API。

软件人员只需要了解一些有关 FPGA 架构的知识，就能够完成 GPU 和 CPU 无法完成的任务，因为它们都是固定芯片，并且没有与外界连接的宽带 (100Gb+) 接口。缩小芯片几何尺寸已不再可能，也不再可能在不熔化单芯片封装的情况下从单芯片封装中提取更多热量，因此这看起来像是单封装芯片的终结。我的论点是，未来属于多芯片系统的并行编程，FPGA 很有可能在竞争中处于领先地位。如果您对性能等有疑问，请查看 http://isfpga.org/。

回复收藏 0 原文

橘香 2024-07-15 18:22:33

CUDA 拥有相当丰富的示例代码库和 SDK，包括 BLAS 后端。尝试找到一些与您正在做的事情类似的示例，也许还可以查看 GPU Gems 系列书籍，用于衡量 CUDA 与您的应用程序的契合程度。我想说，从逻辑角度来看，CUDA 比任何专业 FPGA 开发工具包更容易使用，而且便宜得多。

有一次，我确实研究了 CUDA 来进行索赔准备金模拟建模。网站上有很多很好的讲座链接可供学习。在 Windows 上，您需要确保 CUDA 运行在没有显示器的卡上，因为图形子系统有一个看门狗计时器，它会破坏任何运行时间超过 5 秒的进程。这在 Linux 上不会发生。

任何具有两个 PCI-e x16 插槽的机器都应该支持此功能。我使用的是 HP XW9300，您可以从 eBay 上以相当便宜的价格买到它。如果这样做，请确保它有两个 CPU（而不是一个双核 CPU），因为 PCI-e 插槽位于单独的 Hypertransport 总线上，并且机器中需要两个 CPU 才能使两条总线都处于活动状态。

回复收藏 0 原文

心的憧憬 2024-07-15 18:22:33

基于 FPGA 的解决方案可能比 CUDA 昂贵得多。

回复收藏 0 原文

撩发小公举 2024-07-15 18:22:33

你部署什么？谁是你的客户？即使不知道这些问题的答案，我也不会使用 FPGA，除非您正在构建一个实时系统，并且您的团队中有熟悉 VHDL 和 Verilog 等硬件描述语言的电气/计算机工程师。它有很多内容，并且需要与传统编程不同的思维框架。

回复收藏 0 原文

血之狂魔 2024-07-15 18:22:33

我是一名 CUDA 开发人员，对 FPGA 的经验很少，但我一直在尝试寻找两者之间的比较。

到目前为止我得出的结论是：

GPU 具有更高的（可访问的）峰值性能
它具有更有利的 FLOP/瓦特比。
这更便宜
它的发展速度更快（很快你就会真正拥有“真正的”TFLOP）。
编程更容易（阅读有关此内容的文章，而不是个人观点）

请注意，我说的是真实的/可访问的，以区别于您在 GPGPU 商业广告中看到的数字。

但是，当您需要随机访问数据时，GPU 并不更有利。这有望随着新的 Nvidia Fermi 架构而改变，该架构具有可选的 l1/l2 缓存。

我的2分钱

回复收藏 0 原文

看春风乍起 2024-07-15 18:22:33

其他人已经给出了很好的答案，只是想补充一些不同的观点。这是我在 2015 年 ACM 计算调查中发表的调查论文（其永久链接为此处），比较了 GPU 与 FPGA 和 CPU 的能效指标。大多数论文都报道：FPGA 比 GPU 更节能，而 GPU 又比 CPU 更节能。由于功耗预算是固定的（取决于冷却能力），FPGA 的能效意味着 FPGA 可以在相同的功耗预算内完成更多的计算，从而使用 FPGA 获得比 GPU 更好的性能。当然，正如其他人提到的，还要考虑 FPGA 的限制。

回复收藏 0 原文

软糯酥胸 2024-07-15 18:22:33

FPGA 的并行性比 GPU 高出三个数量级。好的 GPU 具有数千个内核，而 FPGA 可能拥有数百万个可编程门。
虽然 CUDA 核心必须执行高度相似的计算才能提高工作效率，但 FPGA 单元真正相互独立。
FPGA 可以非常快地处理某些任务组，并且通常用于毫秒已经被视为较长持续时间的情况。
GPU 核心比 FPGA 单元更强大，并且更容易编程。它是一个核心，当 FPGA 单元只能执行相当简单的布尔逻辑时，它可以进行除法和乘法运算。
由于GPU核心是一个核心，因此用C++对其进行编程是高效的。即使也可以用 C++ 对 FPGA 进行编程，但效率很低（只是“高效”）。必须使用 VDHL 或 Verilog 等专业语言 - 它们很难掌握且具有挑战性。
软件工程师的大多数真实且经过考验的本能对于 FPGA 来说都是无用的。您想要一个带有这些门的for循环吗？你来自哪个星系？你需要转变为电子工程师的思维方式来理解这个世界。

回复收藏 0 原文

挽袖吟 2024-07-15 18:22:33

FPGA 不会受到那些有软件偏见的人的青睐，因为他们需要学习 HDL 或至少了解 systemC。

对于那些有硬件偏好的人来说，FPGA 将是首选。

事实上，两者都需要牢牢掌握。然后才能做出客观的决定。

OpenCL 设计为在 FPGA 和 FPGA 上运行。 GPU，甚至CUDA都可以移植到FPGA上。

FPGA与 GPU 加速器可以一起使用，

所以这并不存在哪个更好哪个更好的问题。还有关于 CUDA 与 OpenCL 的争论

再次出现，除非你已经优化和优化了。对您的具体应用程序进行基准测试，您无法 100% 确定。

许多人会简单地选择 CUDA，因为它的商业性质和可扩展性。资源。其他人会选择 openCL，因为它具有多功能性。

回复收藏 0 原文

熟人话多 2024-07-15 18:22:33

最近在 GTC'13 上，许多 HPC 人士一致认为 CUDA 将继续存在。 FGPA 很麻烦，CUDA 越来越成熟，支持 Python/C/C++/ARM .. 不管怎样，这是一个过时的问题

回复收藏 0 原文

沉溺在你眼里的海 2024-07-15 18:22:33

在 CUDA 中对 GPU 进行编程肯定更容易。如果您没有任何使用 HDL 进行 FPGA 编程的经验，这对您来说几乎肯定是一个太大的挑战，但您仍然可以使用与 CUDA 有点相似的 OpenCL 对其进行编程。然而，它比 GPU 编程更难实现，而且可能更昂贵。

哪一个更快？

GPU 运行速度更快，但 FPGA 效率更高。

GPU 的运行速度有可能高于 FPGA 所能达到的速度。但仅适用于特别适合于此的算法。如果算法不是最优的，GPU就会损失很多性能。

另一方面，FPGA 的运行速度要慢得多，但您可以实现针对特定问题的硬件，该硬件将非常高效并在更短的时间内完成工作。

这有点像用叉子很快地吃汤，而不是用勺子更慢地吃汤。

这两种设备的性能都基于并行化，但各自的方式略有不同。如果算法可以被分成许多执行相同操作的块（关键字：SIMD），那么 GPU 将会更快。如果算法可以实现为长流水线，那么 FPGA 的速度将会更快。另外，如果你想使用浮点，FPGA 不会很满意:)

我的整个硕士论文都致力于这个主题。
使用 OpenCL 在 FPGA 上进行算法加速

回复收藏 0 原文

~没有更多了~

关于作者

铁轨上的流浪者

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

用于特殊用途 3D 图形计算的 CUDA 或 FPGA？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（15）

FPGA

GPGPU (CUDA/OpenCL)

FPGAs

GPGPU (CUDA/OpenCL)

关于作者

相关话题

热门标签

推荐作者

浪子阿飞

JK.Yang

人间不值得

静待花开

只涨不跌

污浊的双黑

友情链接

用于特殊用途 3D 图形计算的 CUDA 或 FPGA？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（15）

FPGA

GPGPU (CUDA/OpenCL)

FPGAs

GPGPU (CUDA/OpenCL)

关于作者

相关话题

热门标签

推荐作者

浪子阿飞

JK.Yang

人间不值得

静待花开

只涨不跌

污浊的双黑

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。