当前位置：文江博客话题详情

CPU 和数据对齐

发布于 2024-09-05 12:05:36 字数 340 浏览 5 评论 0原文

如果您觉得这个问题已经被回答了很多次，请原谅我，但我需要以下问题的答案！

为什么数据必须对齐（在 2 字节/4 字节/8 字节边界上）？这里我的疑问是，当CPU有地址线Ax Ax-1 Ax-2 ... A2 A1 A0时，很有可能按顺序寻址内存位置。那么为什么需要在特定边界对齐数据？
在编译代码并生成可执行文件时如何找到对齐要求？
例如，如果数据对齐是 4 字节边界，这是否意味着每个连续字节位于模 4 偏移量处？我的疑问是，如果数据是 4 字节对齐，这是否意味着如果一个字节位于 1004，那么下一个字节位于 1008（或 1005）？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

只是一片海 2024-09-12 12:05:36

CPU 是面向字的，而不是面向字节的。在简单的 CPU 中，内存通常配置为每个地址选通返回一个字（32 位、64 位等），其中底部两个（或更多）地址线通常是无关位。

Intel CPU 可以对许多指令的非字边界执行访问，但是，由于 CPU 在内部执行两次内存访问和一次数学运算来加载一个字，因此存在性能损失。如果您正在进行字节读取，则不适用对齐。

某些 CPU（ARM 或 Intel SSE 指令）需要对齐内存，并且在执行未对齐访问（或引发异常）时具有未定义的操作。它们通过不实现更复杂的加载/存储子系统来节省大量的硅空间。

对齐取决于 CPU 字大小（16、32、64 位），或者在 SSE 的情况下取决于 SSE 寄存器大小（128 位）。

对于最后一个问题，如果您一次加载一个数据字节，则大多数 CPU 上没有对齐限制（某些 DSP 没有字节级指令，但您很可能不会遇到）。

回复收藏 0 原文

甚是思念 2024-09-12 12:05:36

“必须”对齐的数据非常少。更重要的是，某些类型的数据可能会执行得更好，或者某些 cpu 操作需要某种数据对齐。

首先，假设您一次读取 4 个字节的数据。假设您的 CPU 有一条 32 位数据总线。假设您的数据存储在系统内存的字节 2 处。

现在，由于您可以一次加载 4 个字节的数据，因此让地址寄存器指向单个字节并没有多大意义。通过使地址寄存器指向每 4 个字节，您可以操作 4 倍的数据。换句话说，你的 CPU 可能只能读取从字节 0、4、8、12、16 等开始的数据。

这就是问题所在。如果您希望数据从字节 2 开始并且您正在读取 4 个字节，那么您的一半数据将位于地址位置 0，另一半位于位置 1。

所以基本上您最终会访问内存两次来读取您的数据4 字节数据元素。某些 CPU 不支持此类操作（或强制您手动加载并组合两个结果）。

转到此处了解更多详细信息：http://en.wikipedia.org/wiki/Data_struct_alignment

回复收藏 0 原文

仅冇旳回忆 2024-09-12 12:05:36

1.) 有些体系结构根本没有此要求，有些体系结构鼓励对齐（访问非对齐数据项时会产生速度损失），有些体系结构可能严格执行它（未对齐会导致处理器异常）。
当今许多流行的架构都属于速度惩罚类别。 CPU 设计者必须在灵活性/性能和成本（硅面积/总线周期所需的控制信号数量）之间进行权衡。

2.) 什么语言，什么架构？请参阅您的编译器手册和/或 CPU 架构文档。

3.) 同样，这完全取决于体系结构（某些体系结构可能根本不允许访问字节大小的项目，或者总线宽度甚至不是 8 位的倍数）。因此，除非您询问特定架构，否则您不会得到任何有用的答案。

回复收藏 0 原文

丶视觉 2024-09-12 12:05:36

一般来说，所有这三个问题的一个答案是“这取决于您的系统”。更多详细信息：

您的内存系统可能无法按字节寻址。除此之外，让处理器访问未对齐的数据可能会导致性能损失。有些处理器（例如较旧的 ARM 芯片）根本无法做到这一点。
阅读您的处理器的手册以及您的代码生成的任何 ABI 规范，
通常当人们引用数据时在某种对齐方式下，它仅指第一个字节。因此，如果 ABI 规范说“数据结构 X 必须是 4 字节对齐”，则意味着 X 应该放置在内存中可被 4 整除的地址处。该声明并未暗示结构 X 的大小或内部布局.
就您的特定示例而言，如果数据从地址 1004 开始进行 4 字节对齐，则下一个字节将位于 1005。

回复收藏 0 原文

刘备忘录 2024-09-12 12:05:36

这完全取决于您使用的CPU！

某些架构仅处理 32（或 36！）位字，您需要特殊指令来加载单个字符或半字。

一些 cpu（特别是 PowerPC 和其他 IBM risc 芯片）不关心对齐，而是从奇数地址加载整数。

对于大多数现代体系结构，您需要将整数与字边界对齐，将长整数与双字边界对齐。这简化了加载寄存器的电路并稍微加快了速度。

回复收藏 0 原文

对不⑦ 2024-09-12 12:05:36

出于性能原因，CPU 需要数据对齐。 Intel 网站详细介绍了如何对齐内存中的数据

迁移到 64 位英特尔® 架构时的数据对齐

<块引用>
<块引用>
其中之一是数据项的对齐——它们在内存中的位置与四、八或 16 字节倍数的地址相关。在16位Intel架构下，数据对齐对性能的影响很小，并且它的使用完全是可选的。在 IA-32 下，正确对齐数据可能是一项重要的优化，尽管它的使用仍然是可选的，只有极少数例外，其中正确对齐是强制性的。然而，64位环境对数据项提出了更严格的要求。未对齐的对象会导致程序异常。为了使项目正确对齐，它必须满足 64 位 Intel 架构（稍后讨论）以及用于构建应用程序的链接器的要求。
数据对齐的基本规则是最安全（且支持最广泛）的方法依赖于英特尔所说的“自然边界”。当您将数据项的大小四舍五入到下一个最大大小（两个、四个、八个或 16 个字节）时，就会发生这些情况。例如，10 字节浮点数应与 16 字节地址对齐，而 64 位整数应与 8 字节地址对齐。因为这是 64 位架构，所以指针大小都是八字节宽，因此它们也应该在八字节边界上对齐。
建议所有大于 16 字节的结构都在 16 字节边界上对齐。一般来说，为了获得最佳性能，请按如下方式对齐数据：
在任意地址对齐 8 位数据
将 16 位数据对齐，使其包含在对齐的四字节字中
对齐 32 位数据，使其基地址为 4 的倍数
对齐 64 位数据，使其基地址为 8 的倍数
对齐 80 位数据，使其基地址为 16 的倍数
对齐 128 位数据，使其基地址为 16 的倍数
64 字节或更大的数据结构或数组应进行对齐，以便其基地址是 64 的倍数。按大小递减顺序对数据进行排序是帮助自然对齐的一种启发式方法。只要 16 字节边界（和缓存行）永远不会交叉，自然对齐就不是绝对必要的，尽管它是强制遵守一般对齐建议的简单方法。
在结构内正确对齐数据可能会导致数据膨胀（由于正确放置字段所需的填充），因此在必要和可能的情况下，重新组织结构非常有用，以便需要最宽对齐的字段位于结构中的第一个位置。有关解决此问题的更多信息，请参阅“为 IA-64 架构准备代码（代码清理）”一文。

Data alignment is required by CPU for performance reason. Intel website give out the detail on how to align the data in the memory

Data Alignment when Migrating to 64-Bit Intel® Architecture

One of these is the alignment of data items – their location in memory in relation to addresses that are multiples of four, eight or 16 bytes. Under the 16-bit Intel architecture, data alignment had little effect on performance, and its use was entirely optional. Under IA-32, aligning data correctly can be an important optimization, although its use is still optional with a very few exceptions, where correct alignment is mandatory. The 64-bit environment, however, imposes more-stringent requirements on data items. Misaligned objects cause program exceptions. For an item to be aligned properly, it must fulfill the requirements imposed by 64-bit Intel architecture (discussed shortly), plus those of the linker used to build the application.
The fundamental rule of data alignment is that the safest (and most widely supported) approach relies on what Intel terms "the natural boundaries." Those are the ones that occur when you round up the size of a data item to the next largest size of two, four, eight or 16 bytes. For example, a 10-byte float should be aligned on a 16-byte address, whereas 64-bit integers should be aligned to an eight-byte address. Because this is a 64-bit architecture, pointer sizes are all eight bytes wide, and so they too should align on eight-byte boundaries.
It is recommended that all structures larger than 16 bytes align on 16-byte boundaries. In general, for the best performance, align data as follows:
Align 8-bit data at any address
Align 16-bit data to be contained within an aligned four-byte word
Align 32-bit data so that its base address is a multiple of four
Align 64-bit data so that its base address is a multiple of eight
Align 80-bit data so that its base address is a multiple of sixteen
Align 128-bit data so that its base address is a multiple of sixteen
A 64-byte or greater data structure or array should be aligned so that its base address is a multiple of 64. Sorting data in decreasing size order is one heuristic for assisting with natural alignment. As long as 16-byte boundaries (and cache lines) are never crossed, natural alignment is not strictly necessary, although it is an easy way to enforce adherence to general alignment recommendations.
Aligning data correctly within structures can cause data bloat (due to the padding necessary to place fields correctly), so where necessary and possible, it is useful to reorganize structures so that fields that require the widest alignment are first in the structure. More on solving this problem appears in the article "Preparing Code for the IA-64 Architecture (Code Clean)."