cl_khr_fp64 和 cl_amd_fp64 之间的区别？

发布于 2025-01-02 05:05:31 字数 374 浏览 5 评论 0原文

我刚刚发现在我的（相当昂贵的）Radeon 6970 上，仅支持 cl_amd_fp64 扩展。使用 cl_amd_fp64 运行时，我在代码的某些部分得到奇怪的结果（访问 0.005 的值实际上使用 1.99916e+37？）。在 CPU 上使用 cl_khr_fp64 和 Intel SDK 效果很好。（输入缓冲区完全相同）

扩展页面给出信息很少。

两者到底有什么区别？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

痴情换悲伤 2025-01-09 05:05:31

cl_khr_fp64 是 Khronos 官方双精度浮点精度扩展。它要求算术符合 IEEE 754-2008，并支持全系列 OpenCL 向量类型和标准库函数。

最初，AMD 仅实现了 cl_khr_fp64 扩展所需的一部分，因此他们发布了自己的供应商扩展 cl_amd_fp64 以支持其 GPU 硬件上的双精度。当它第一次出现时，支持范围非常有限（可能只有 +、-、* 以及非标准舍入行为 IIRC），但随着连续的 SDK 版本和新的硬件修订，它已经慢慢扩展。如果我没记错的话，他们会在发行说明中列出支持的内容。

我已经有一段时间没有密切关注他们的进展了，所以我不确定为什么会发生你所看到的情况。如果您安装了最新的驱动程序和流 SDK 版本，我建议您整理一个重现案例并提交错误报告。可能是您正在使用他们不支持或不保证结果的东西，但也可能是您发现了错误。

回复收藏 0 原文

~没有更多了~