经营者业绩|与运营商的比较+

发布于 2024-11-11 13:31:49 字数 441 浏览 7 评论 0原文

| 之间有什么重大区别吗？和 + 从长远来看会影响代码的性能吗？或者都是 O(1)？我正在使用的代码是这样的：

uint64_t dostuff(uint64_t a,uint64_t b){
        // the max values of the inputs are 2^32 - 1

        // lots of stuff involving boolean operators
        // that have no way of being substituted by 
        // arithmetic operators

        return (a << 32) + b;
        //or
        return (a << 32) | b;
}

该代码将被多次使用，所以我想尽可能地加快速度。

原文

Is there any major difference between | and + that would affect a code's performance in the long run? or are both O(1)? the code i am working with is something like this:

uint64_t dostuff(uint64_t a,uint64_t b){
        // the max values of the inputs are 2^32 - 1

        // lots of stuff involving boolean operators
        // that have no way of being substituted by 
        // arithmetic operators

        return (a << 32) + b;
        //or
        return (a << 32) | b;
}

the code will be used many times, so i want to speed it up as much as possible.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

┊风居住的梦幻卍 2024-11-18 13:31:49

在任何现代计算机上都没有性能差异。

但这两个运算符具有不同的含义。如果该位已设置，| 将不执行任何操作，但 + 将清除该位和所有后续非零位，并将下一个零位设置为 1。

回复收藏 0 原文

十二 2024-11-18 13:31:49

两者肯定都是 O(1)，因为 O(1) 意味着一个常数。它们可能不是相同的常数。 Big Oh 表示法旨在理解独立于常数的渐近行为。

哦，是的，还有一件事。始终在优化之前进行分析。你很快就会发现时间并没有花在你想的地方。永远！

回复收藏 0 原文

染墨丶若流云 2024-11-18 13:31:49

使用|。

+ 只能增加操作时间，原因很明显。

回复收藏 0 原文

何以笙箫默 2024-11-18 13:31:49

两者都是一条指令。至于电子传播时间，不知道哪一个更快。

我想，您可以自己测试速度，但由于差异可能是线性的（如果可以检测到的话），并且受到噪声因素的影响，这可能有点困难。

回复收藏 0 原文

妳是的陽光 2024-11-18 13:31:49

这里最好的答案不是试图预测哪一个更好，而是对其进行基准测试或检查汇编代码。我猜测两者都会针对相同的指令进行优化，并且在任何情况下两者占用的 CPU 周期数可能相同。

但我强烈建议您检查 ASM 并对这两种解决方案进行基准测试。

回复收藏 0 原文

巴黎盛开的樱花 2024-11-18 13:31:49

如果有什么优势的话，那肯定是或有利。然而，实际上，在任何相当现代的 CPU（甚至除了真正古老的 CPU）上都不可能有任何差异。

基本上，or 只是设置位，仅此而已。只需要一个二输入或门即可，因此您恰好得到一个传播延迟门。

加法器有点复杂：计算当前位需要三输入异或。 XOR 通常由两级门组成。此外，它还生成一个进位，该进位必须用作加法器下一位的输入。因此，“纹波进位加法器”需要与被添加的位一样多的时钟周期。有更聪明的方法来处理这个问题，将进位与加法的其余部分分开处理，这样就可以得到较低的传播延迟，但在最坏的情况下，即使这些也无济于事。

不过，其中大部分仅在您自己设计 CPU 时才重要。如果您使用的是典型的 CPU，功能单元中的门运行得足够快，它可以/将在一个时钟周期内完成完整的加法。一些相当新的甚至可以在单个功能单元中每个时钟周期执行两次添加。

回复收藏 0 原文

沧笙踏歌 2024-11-18 13:31:49

| 和 '+` 是不同的数学运算。
给定方程：

  unsigned int y = 2 + 2;
  unsigned int z = 2 | 2;

将产生不同的答案。

从技术上讲，“|”运算速度更快，因为它仅使用处理器内部的“或”门。加法运算需要更多的门。

使用“|”获得的性能'+' 上的字符通常浪费在将数据传入和传出处理器所需的时间上。换句话说，净性能可以忽略不计。（时间差通常在纳秒范围内。）

但是，两种形式之间的维持时间可能会更长。当一个人需要算术而不是位运算（反之亦然）时，尝试找到这个运行时错误可能会很棒。

为了正确的目的使用正确的操作员。让测试和维护小组休息一下。这种微观优化是不值得的。

The | and '+` are different mathematical operations.
Given the equations:

  unsigned int y = 2 + 2;
  unsigned int z = 2 | 2;

will yield different answers.

Technically, the `|' operation is faster since it only uses OR gates inside the processor. The addition operation requires more gates.

The performance gained by using '|' over '+' is usually wasted by the time required to fetch data into and out of the processor. In otherwords, the net performance is negligible. (The time difference is usually in the range of nanoseconds.)

However, the maintenance time between the two forms may be greater. When one is needing arithmetic rather than bit twiddling (or vice versa), trying to find this runtime error can be great.

Use the proper operator for the proper purpose. Give the testing and maintenance groups a break. This kind of micro-optimization is not worthwhile.

回复收藏 0 原文

荒岛晴空 2024-11-18 13:31:49

这是特定于平台的（并且可能是特定于编译器的）。如果我没记错的话，在 PS3 上的 SPU 上，动态 OR 相当昂贵。我不确定具体数字，但我认为最终会将其分为多个操作，导致成本扩展到多个指令。在 x86/x64 或大多数现代 CISC 上，很可能其中任一指令只是一条指令，并且不太可能导致任何管道停顿或其他昂贵的操作。

编辑：
造成成本的原因是 Cell 处理器只有一个通用寄存器，这意味着它无法将两个变量加载到标准寄存器中并执行优化。相反，必须将值加载到必须完成操作的 altivec 寄存器集中，然后必须通过掩码将结果从 altivec 寄存器提取到 gpr 中，以便检索结果。

如果您将这些操作推送到 PS3 或任何现代计算机上的 GPU 上，您可能需要研究这些处理器的行为方式。 GPU 也可能有类似的问题，因为它们也是专用于 SIMD 操作的 RISC 处理器。

回复收藏 0 原文

~没有更多了~