如何比较 C++ 中 log() 和 fp 除法的性能？

发布于 2024-09-02 07:24:33 字数 610 浏览 11 评论 0原文

我在 C++ 中使用基于日志的类来存储非常小的浮点值（因为这些值超出了 double 的范围）。当我执行大量乘法时，这具有将乘法转换为和的额外好处。

但是，在我的算法中的某个时刻，我需要将标准 double 值除以 integer 值，然后执行 *= 来基于日志的值。我已经为基于日志的类重载了 *= 运算符，并且首先通过运行 log() 将右侧值转换为基于日志的值，然后添加到左侧值。因此实际执行的操作是浮点除法、log()和浮点求和。

我的问题是，首先将分母转换为基于对数的值是否会更快，这将用浮点减法代替浮点除法，产生以下操作链：两次 log()、浮点减法、浮点求和。

最后，这归结为浮点除法比 log() 更快还是更慢。我怀疑一个常见的答案是，这是依赖于编译器和体系结构的，所以我会说我在 darwin 10.3.0 上使用 Apple 的 gcc 4.2。尽管如此，我还是希望得到一个答案，对这两个运算符的速度进行一般性评论和/或了解如何自己测量差异，因为这里可能会发生更多事情，例如执行执行类型转换的构造函数等等

干杯！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

小镇女孩 2024-09-09 07:24:33

你是否多次除以同一个整数？如果是这样，您可以乘以 1./yourInteger，并且只除一次。如果可能的话，这会比任何一个都快。

至于您的实际问题，它不仅取决于编译器和体系结构，还取决于微体系结构和数据。

在您的特定平台 (darwin/x86) 上，对于当前硬件 i5/i7：divide(1) 约为 24 个周期，log( )(2) 约为 35 个周期。然而，由于除法仅使用单个指令调度槽，因此硬件的重新排序引擎可以在除法运行时执行其他有用的计算；相比之下，log( ) 是在软件中实现的，因此处理器将其他计算提升到对数延迟的机会较少。这意味着在实践中，除法通常会更快一些。

1) 来自英特尔优化手册

2) 通过在紧密循环中调用 log( ) 并使用 mach_absolute_time( ) 获取挂起时间来测量。

回复收藏 0 原文

故人爱我别走 2024-09-09 07:24:33

在 x86 架构上，对数比除法花费的时间明显更长：FYL2X 需要 85 个周期（吞吐量）与 FDIV 的 40 个周期相比。如果其他架构有很大不同，我会感到惊讶。使用浮点除法。

回复收藏 0 原文

旧人 2024-09-09 07:24:33

除法的主要问题是，尽管它在大多数现代 CPU 上是一条指令，但通常具有较高的延迟（PowerPC 上为 31 个周期 - 不确定 x86 上是什么）。如果您有其他可以与除法同时发出的非相关指令，则可能会隐藏一些延迟。因此，答案在某种程度上取决于包含除法的循环中的指令组合类型和依赖关系（更不用说您正在使用哪个 CPU）。

话虽如此，我的直觉是，在大多数架构上，除法将比日志函数更快。

回复收藏 0 原文