micro-optimization

文章 0 浏览 6

如果我不需要获取语义，那么使用轻松的负载然后是有条件的围栏是有意义的吗？

请考虑以下玩具示例，尤其是结果函数： #include #include #include #include class Worker { std::thread th; std::atomic_bool done = false; int v…

∞琼窗梦回ˉ 2025-02-06 20:35:44 1 0

＆＃x27; i％2 == 0＆＃x27;在Clang和GCC之间，为什么会这样编译？

我很好奇编译器是否对 n％＆lt;的代码进行了明显的优化。等于 /不等于0 。确实他们确实如此，但是有一些有趣的细微差别，所以这里有两个问题：对于 i…

萌面超妹 2025-02-02 16:06:53 1 0

直接在多个说明中使用静态数据地址，还是将其移至寄存器中并使用它？

考虑一下我在 .rodata 部分中都有一个数据表...现在在我的功能中，我想使用该数据表，3-4次...我有2个选项：选项1（较少的代码尺寸）： mov rax, MY_…

抱猫软卧 2025-02-02 00:27:21 2 0

将查找表优化到简单的Alu

问题说您有一个简单的函数，可以根据外观表返回值：例如：请参阅“关于假设”的编辑。 uint32_t lookup0(uint32_t r) { static const uint32_t tbl[…

╰◇生如夏花灿烂 2025-01-30 05:14:07 3 0

在不同的ARM64微构造上优化FMA序列

为了优化大量使用的内部循环（Winograd域中的3x3xn张量卷积），我通过使用最大霓虹灯寄存器（32）（32）并尝试将其读取为少的系数/数据，而与算术操作…

金兰素衣 2025-01-26 19:35:55 1 0

修改 64 位变量的低字节，例如 rax/al 寄存器，无需编译器开销

我有一段对性能至关重要的代码，其中实际上包含 uint8_t 变量（保证不会溢出），这些变量是从其他 uint8_t 值递增的，也用作数组索引和其他 64 位地址…

伤痕我心 2025-01-19 19:04:37 2 0

现在在 x86-64 上还值得使用 Quake 快速反平方根算法吗？

具体来说，这就是我正在谈论的代码： float InvSqrt(float x) { float xhalf = 0.5f*x; int i = *(int*)&x; // warning: strict-aliasing UB, use mem…

甜心小果奶 2025-01-16 16:23:06 5 0

cuda10+ 中 uint2 和 uint64_t 之间是否存在性能/存储差异？

我正在尝试优化 A100 GPU（安培代）的一段代码，现在我们使用 uint64_t，但我看到在一些 cuda 代码中使用了 uint2 数据类型。 uint2 在寄存器使用方面…

倚栏听风 2025-01-12 12:49:55 4 0

内联分配作为确保读取顺序的一种方式

在Java7的ForkJoinPool类中，有一条关于实现的注释，其中指出：方法 signalWork() 和 scan() 是主要瓶颈，因此尤其受到严重的微优化/破坏。有很多内…

变身佩奇 2025-01-07 12:37:56 3 0

std::类似向量的类经过优化以容纳少量项目

在程序的一个时间关键部分中，有一个类成员如下所示： std::vector m_vLinks；在分析过程中，我注意到该向量大约 99.98% 的执行仅包含 0 或 1 个项目…

懒的傷心 2025-01-07 11:29:34 3 0

了解特定的 CIL/CLR 优化

编辑：我在最后添加了 ASM。我相信学习如何在平台上编写优秀代码的最佳方法是尝试该平台，从而了解它。因此，这个问题旨在加深对 CLR 的理解，而不是…

峩卟喜欢 2024-12-28 21:07:42 5 0

CSS 的速度

这只是一个帮助我更好地理解 CSS 渲染的问题。假设我们有一百万行这样的代码。 Hello World 将 Hello World 的字体更改为红色的最快方法是什么？ .th…

策马西风 2024-12-28 17:43:51 5 0

不等式算子的性能

Closed. This question needs debugging details. It is not currently accepting answers. 编辑问题以包含所需行为、特定问题或错误以及重现问题所…

葬花如无物 2024-12-28 04:54:01 3 0

应该使用 if ($a != NULL) 还是 if ($a !== NULL) 来控制程序流程？

这可能是一个令人痛苦的基本问题，但我想知道使用 PHP 的 if equal !== 与 if equal 的性能问题!= 控制流程。考虑以下简单的 PHP 函数：

划一舟意中人 2024-12-27 08:33:25 3 0

使用变量与在 PHP 中反复调用相比，性能更好吗？

Closed. This question needs to be more focused. It is not currently accepting answers. 想要改进这个问题？通过编辑这篇文章来更新问题，使其仅…

_畞蕅 2024-12-23 16:52:58 4 0

共 9 页
1
2
3
4
5
下一页

关注

友情链接

文江博客