当前位置：文江博客话题详情

GPU 上的高精度数学

发布于 2024-08-05 14:36:25 字数 97 浏览 7 评论 0原文

我有兴趣使用 HLSL 在 GPU 上实现算法，但我主要关心的问题之一是我想要可变的精度级别。是否有可以在 GPU 上实现的模拟 64 位及更高精度的技术。

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

拥有 2024-08-12 14:36:25

GPU 刚刚开始在硬件中支持双精度，尽管在不久的将来它的速度仍将比单精度慢得多。多年来已经开发了多种技术来使用由多个浮点组成的表示来合成更高精度的浮点，无论精度如何，都具有快速的硬件支持，但开销相当大。 IIRC，crlibm 手册对其中一些技术进行了很好的讨论，包括错误分析和伪代码（CRLIBM 使用它们将数字表示为多个双精度值，但相同的技术可以用于单精度值）

无需了解更多关于你想要做什么，很难给出更好的答案。对于某些算法来说，只有一小部分计算需要较高的精度；如果您遇到这种情况，您可能会在 GPU 上获得不错的性能，尽管代码不一定非常漂亮或易于使用。如果您在整个算法中普遍需要高精度，那么 GPU 目前对您来说可能不是一个有吸引力的选择。

最后，为什么选择 HLSL 而不是 CUDA 或 OpenCL 等面向计算的语言？

回复收藏 0 原文

蹲墙角沉默 2024-08-12 14:36:25

使用两个浮点数（即单精度值），可以实现大约 56 位的精度。这接近双精度数的精度，但是您可以为此“双精度单”数据类型实现的许多操作都很慢，并且不如使用双精度数精确。然而，对于简单的算术运算，它们通常就足够了。

这篇论文讨论了一些关于这个想法和描述如何实现乘法运算。有关您可以执行的操作以及如何实施的更完整列表，请查看 DSFUN90 包此处。该包是用 Fortran 90 编写的，但可以转换为任何具有单精度数字的内容。但请注意，您必须获得他们的库许可才能将其用于商业目的。我相信 Mersenne-Twister CUDA 演示应用程序也具有加法和乘法运算的实现。

回复收藏 0 原文