当前位置：文江博客话题详情

cpu assembly low-level

先读然后条件写与写

发布于 2024-08-23 12:34:45 字数 365 浏览 13 评论 0原文

平均而言，哪个更快 - 检查该值，然后根据需要进行分配，还是简单地分配？或者，用 C++ 术语来说：

bool b;
if(b)
    b = false;

或

b = false;

假设 if() 条件为真，概率为 50%。答案很可能是高度依赖于架构的 - 请说出您的低级考虑因素。写入总是会弄脏缓存线 - 对吗？因此，通过避免写入，我们可以在 0.5 种情况下避免缓存刷新。但是足够智能的缓存可能会检测到微不足道的写入，并且本身不会变脏。但无条件写入始终是 1 次内存操作，而读写平均是 1.5 次操作。

免责声明：这是一个好奇问题，而不是我实际面临的问题。

Which is, on average, faster - check the value then, if needed, assign, or simply assign? Or, in C++ terms:

bool b;
if(b)
    b = false;

or

b = false;

Assume that the if() condition is true with 50% probability. The answer will be, most likely, highly architecture dependent - please voice your low-level considerations. Writing always dirties the cache line - right? So by avoiding a write we avoid a cache flush in 0.5 cases. But a smart enough cache might detect a trivial write and not dirty itself. But the unconditional write is always exactly one memory operation, and read-write is, on average, 1.5 operations.

Disclaimer: this is a curiosity question, not a problem I actually face.

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（7）

长安忆 2024-08-30 12:34:45

分支在现代 CPU 上的成本很高，而内存访问在嵌入式/较旧的 CPU 上的成本也很高。因此，平面分配总是会更快，除非您有某种奇怪的内存，写入时间比读取时间长（提示：您不需要），

特别是由于以下原因，情况更糟：

分支指令。处理器可以预测到这一点，但仍然可能会产生开销。
2 次内存访问而不是 1 次。大多数形式的内存上的读取和写入速度相同，既然可以执行一次，为什么还要执行两次呢？
更多代码开销。这是一个微型指令，但必须发出更多指令来执行 if 语句。因此意味着额外的内存读取和缓存中不必要的更多空间消耗。
对于悲观的人来说，这可能意味着 C++ 编译器决定将此变量放入寄存器中，而不是其他更必要的变量。
此外，如果您假设 b 被放入寄存器中。寄存器读/写非常便宜，但它们不是免费的。

回复收藏 0 原文

醉态萌生 2024-08-30 12:34:45

为了获得实际结果，在不同的架构上进行分析绝对是值得的。

回复收藏 0 原文

落在眉间の轻吻 2024-08-30 12:34:45

这取决于多种因素：

分支的可预测性如何（在第一种情况下）
b 是否已经在寄存器中
您正在使用什么架构

回复收藏 0 原文

孤千羽 2024-08-30 12:34:45

除了分析建议之外，它实际上还取决于备份该写入请求的内存 - 例如，如果它是内存映射闪存设备，则写入可能会非常昂贵。

回复收藏 0 原文

私野 2024-08-30 12:34:45

最近，我一直在阅读有关快速压缩技术的论文，其中有人强调需要避免 if 分支以实现最佳性能。其原因在于CPU 流水线。使用 if 会破坏 CPU 并行执行部分代码时可以进行的许多优化。因此，如果您有很多此类操作，那么使用 b = false 可能会更快。

回复收藏 0 原文

云淡月浅 2024-08-30 12:34:45

在现代流水线处理器上，您需要考虑到这一点：

错误预测的分支会花费大量
存储和加载时间，
缓存可能会加快读取和写入速度，但如果它是多缓存架构并且b 正在多个缓存中被修改，多次写入可能意味着多次缓存逐出，并且可能会抵消缓存的性能。

带有条件写入的读取至少有一次内存访问和一个可能会错误预测的分支。假设分支占 50% 的时间，则平均有 1.5 次内存访问，再加上错误预测的可能性。

无条件写入恰好有一次内存访问并且没有任何分支。

现在，您需要平衡错误预测的成本与存储的成本，该成本根据您拥有的缓存代理数量而变化。

回复收藏 0 原文

纵性 2024-08-30 12:34:45

如果您正在进行指针、引用或基本值类型的分配，我个人认为直接分配会更快（热衷于在探查器上查看结果）。在 50% 概率的环境中，您可能会执行更多将值放入寄存器的指令。分配触发赋值运算符的结构或类对象将是最昂贵的。条件逻辑还引入了更多指令，并增加了代码复杂性指标

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

知足的幸福

文章 0 评论 0

我一向站在原地

文章 0 评论 0

慕烟庭风

文章 0 评论 0

秉忠贞之诚守退让之实

文章 0 评论 0

小兔几

文章 0 评论 0

mb_3y7WUgWY

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文