检测浮点软件仿真

发布于 2024-11-06 04:40:20 字数 226 浏览 0 评论 0原文

我正在开发一个应用程序，其中运行速度比精度更重要。数字运算涉及浮点运算，我担心 double 和/或 long double 是在软件中处理的，而不是在处理器上本地处理的（这在32 位架构对吧？）。我想在硬件支持下使用最高精度进行条件编译，但我还没有找到一种快速简便的方法来检测软件模拟。我在 GNU/Linux 上使用 g++，我不关心可移植性。它在 x86 架构上运行，因此我假设 float 始终是本机的。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

記憶穿過時間隧道 2024-11-13 04:40:20

现代 x86 上的浮点单元 (FPU) 本质上是双精度型（事实上，它甚至比双精度型更大），而不是浮点型（32 位中的“32”描述的是整数寄存器宽度，而不是浮点宽度）。但是，如果您的代码利用向量化 SSE 指令（并行执行 4 个单精度操作或 2 个双精度操作），则情况并非如此。

如果没有，那么将应用程序从浮动切换到双倍所带来的主要速度影响将在于增加的内存带宽。

回复收藏 0 原文

自找没趣 2024-11-13 04:40:20

（这在 32 位架构上总是正确的，对吗？）

不。常见的 CPU 具有用于 double 的专用硬件（在某些情况下也有 long double）。老实说，如果性能是一个问题，那么您应该了解您的 CPU。查看 CPU 手册，找出每种数据类型的性能损失是什么。

即使在缺乏“适当的”double 支持的 CPU 上，它仍然没有在软件中模拟。 Cell CPU（以 Playstation 3 闻名）只是将双精度值通过 FPU 两次，因此它比浮点计算成本高得多，但它不是软件模拟。您仍然有用于双重处理的专用指令。它们只是比等效的 float 指令效率低。

除非您的目标是 20 年历史的 CPU 或小型、有限的嵌入式处理器，否则浮点指令将在硬件中处理，尽管并非所有架构都能同样有效地处理每种数据类型