为什么数据结构的大小通常为 2^n？

发布于 2024-08-12 14:35:51 字数 199 浏览 5 评论 0原文

有历史原因还是什么原因吗？我已经见过很多次类似 char foo[256]; 或 #define BUF_SIZE 1024 的东西。即使我也大多只使用 2ⁿ 大小的缓冲区，主要是因为我认为它看起来更优雅，这样我就不必考虑具体的数字。但我不太确定这是否是大多数人使用它们的原因，如果有更多信息，我们将不胜感激。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

盛装女皇 2024-08-19 14:35:51

可能有很多原因，尽管很多人会像你说的那样只是出于习惯而这样做。

它非常有用的一个地方是循环缓冲区的有效实现，特别是在 % 运算符昂贵的架构上（没有硬件除法的架构 - 主要是 8 位微控制器）。在这种情况下，通过使用 2^n 缓冲区，模数只是位屏蔽高位的情况，或者在 256 字节缓冲区的情况下，只需使用 8 位索引并使其环绕。

在其他情况下，与页面边界、缓存等对齐可能会为某些体系结构提供优化机会 - 但这将是非常特定于体系结构的。但可能只是这样的缓冲区为编译器提供了优化的可能性，所以在其他条件相同的情况下，为什么不呢？

回复收藏 0 原文

往事随风而去 2024-08-19 14:35:51

高速缓存行通常是 2 的倍数（通常是 32 或 64）。该数量的整数倍的数据将能够适合（并充分利用）相应数量的缓存行。可以打包到缓存中的数据越多，性能就越好。所以我认为以这种方式设计结构的人正在为此进行优化。

回复收藏 0 原文

还在原地等你 2024-08-19 14:35:51

除了其他人提到的之外，另一个原因是，SSE 指令采用多个元素，并且输入的元素数量始终是 2 的幂。将缓冲区设置为 2 的幂可以保证您不会读取未分配的内存。但这仅适用于您实际使用 SSE 指令的情况。

但我认为最终，在大多数情况下压倒性的原因是程序员喜欢二的幂。

回复收藏 0 原文

神经暖 2024-08-19 14:35:51

哈希表，按页分配

这对于哈希表确实很有帮助，因为您计算索引的大小为模，如果该大小是 2 的幂，则可以使用简单的按位与来计算模数或 & 而不是使用速度慢得多的除法指令来实现 % 运算符。

看一本旧的 Intel i386 书，and 是 2 个周期，div 是 40 个周期。尽管整体周期时间快了 1000 倍，但往往会掩盖最慢机器操作的影响，但由于除法的基本复杂性大大提高，这种差异如今仍然存在。

也曾有一段时间，偶尔会大力避免 malloc 开销。直接从操作系统可用的分配将是（仍然是）特定数量的页面，因此 2 的幂可能会充分利用分配粒度。

而且，正如其他人所指出的，程序员喜欢二的幂。

回复收藏 0 原文

痴梦一场 2024-08-19 14:35:51

我可以立即想到几个原因：

2^n 是所有计算机尺寸中非常常见的值。这与计算机中表示位的方式（2 个可能的值）直接相关，这意味着变量往往具有边界为 2^n 的值范围。
由于上述原因，您经常会发现缓冲区的大小为 256。这是因为它是一个字节中可以存储的最大数字。因此，如果您想将字符串与字符串的大小一起存储，那么如果将其存储为：SIZE_BYTE+ARRAY，其中大小字节告诉您字符串的大小，那么效率最高。数组。这意味着数组可以是从 1 到 256 之间的任意大小。
很多时候，大小是根据物理事物来选择的（例如，操作系统可以选择的内存大小与 CPU 寄存器的大小有关）等）并且这些也将是特定数量的位。这意味着，您可以使用的内存量通常为 2^n 的某个值（对于 32 位系统，为 2^32）。
这些值可能存在性能优势/对齐问题。大多数处理器一次可以访问一定数量的字节，因此即使您有一个大小为 20 位的变量，无论如何，32 位处理器仍然会读取 32 位。因此，将变量设为 32 位通常会更高效。此外，某些处理器要求变量与一定数量的字节对齐（因为它们无法从例如内存中的奇数地址读取内存）。当然，有时并不是奇数内存位置，而是 4 的倍数或 8 的 6 倍等的位置。因此，在这些情况下，制作始终对齐的缓冲区会更有效。

好吧，这些观点有点混乱。如果您需要进一步解释，请告诉我，特别是 IMO 中最重要的第 4 点。

回复收藏 0 原文

挽手叙旧 2024-08-19 14:35:51

由于电子学中 2 进制算术的简单性（另请参阅成本）：左移（乘以 2）、右移（除以 2）。

在 CPU 领域，许多结构都围绕 2 进制算术展开。用于访问存储器结构的总线（控制和数据）通常在功率 2 上对齐。电子器件（例如 CPU）中逻辑实现的成本使得基数 2 中的算术引人注目。

当然，如果我们有模拟计算机，情况就会有所不同。

仅供参考：位于 X 层的系统的属性是 X 层的服务器层属性的直接结果位于 ie 层以下的系统 < x。我之所以这么说，是因为我收到了一些关于我的帖子的评论。

例如，可以在“编译器”级别操作的属性是继承和继承的。源自其下方系统（即 CPU 中的电子器件）的属性。

回复收藏 0 原文

十雾 2024-08-19 14:35:51

我本来打算使用转变论点，但可以想出一个很好的理由来证明它的合理性。

对于 2 的幂的缓冲区来说，一个好处是循环缓冲区处理可以使用简单的与而不是除法：

#define BUFSIZE 1024

++index;                // increment the index.
index &= BUFSIZE;       // Make sure it stays in the buffer.

如果它不是 2 的幂，则需要除法。在过去（目前在小芯片上）这很重要。

I was going to use the shift argument, but could think of a good reason to justify it.

One thing that is nice about a buffer that is a power of two is that circular buffer handling can use simple ands rather than divides:

#define BUFSIZE 1024

++index;                // increment the index.
index &= BUFSIZE;       // Make sure it stays in the buffer.

If it weren't a power of two, a divide would be necessary. In the olden days (and currently on small chips) that mattered.

回复收藏 0 原文

伤感在游骋 2024-08-19 14:35:51

页大小为 2 的幂也很常见。

在 Linux 上，我喜欢在执行诸如对缓冲区进行分块并将其写入套接字或文件描述符之类的操作时使用 getpagesize()。

回复收藏 0 原文

很快妥协 2024-08-19 14:35:51

它是一个很好的以 2 为基数的整数。就像 10、100 或 1000000 都是很好的以 10 为基数的整数一样。

如果它不是 2 的幂（或接近的数字，例如 96=64+32 或 192= 128+64)，那么您可能想知道为什么会增加精度。非以 2 为底的舍入大小可能来自外部限制或程序员的无知。您会想知道它是哪一个。

其他答案也指出了一系列在特殊情况下有效的技术原因。我不会在这里重复其中任何一个。

回复收藏 0 原文

独夜无伴 2024-08-19 14:35:51

在哈希表中，2^n 使得以某种方式更容易处理键冲突。一般来说，当发生密钥冲突时，您要么创建一个子结构，例如具有相同哈希值的所有条目的列表；要么创建一个子结构，例如列表，其中包含具有相同哈希值的所有条目。或者您找到另一个空闲插槽。您可以将槽索引加 1，直到找到空闲槽；但这种策略并不是最优的，因为它会产生阻塞区域的集群。更好的策略是计算第二个哈希数h2，使得gcd(n,h2)=1；然后将 h2 添加到槽索引，直到找到空闲槽（带有环绕）。如果n是2的幂，找到满足gcd(n,h2)=1的h2很容易，每个奇数都可以。

回复收藏 0 原文

~没有更多了~