什么是寄存器%eiz？

发布于 2024-08-26 21:39:47 字数 146 浏览 16 评论 0原文

在我使用 objdump 转储出来的以下汇编代码中：

lea    0x0(%esi,%eiz,1),%esi

什么是寄存器 %eiz？前面的代码是什么意思？

原文

In the following assembly code that I dumped out using objdump:

lea    0x0(%esi,%eiz,1),%esi

What is register %eiz? What does the preceding code mean?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

情丝乱 2024-09-02 21:39:47

请参阅为什么 GCC LEA EIZ ？：

显然 %eiz 是一个伪寄存器，其值始终为零（如 MIPS 上的 r0）。

...

我最终找到了 binutils 大师 Ian Lance Taylor 的邮件列表帖子，其中揭示了答案。有时，GCC 会在代码流中插入 NOP 指令，以确保正确对齐等。 NOP 指令占用一个字节，因此您可能会认为可以根据需要添加任意数量的字节。但根据 Ian Lance Taylor 的说法，芯片执行一条长指令比执行许多短指令要快。因此，他们没有插入 7 个 NOP 指令，而是使用一个奇怪的 LEA，它占用了 7 个字节，在语义上等同于 NOP。

回复收藏 0 原文

雪化雨蝶 2024-09-02 21:39:47

（游戏已经很晚了，但这似乎是一个有趣的补充）：它根本不是寄存器，而是英特尔指令编码的一个怪癖。当使用 ModRM 字节从内存加载时，寄存器字段使用 3 位来存储 8 个可能的寄存器。但是 ESP（堆栈指针）“应该”所在的位置被处理器解释为“该指令后面有一个 SIB 字节”（即，它是扩展寻址模式，而不是对 ESP 的引用）。由于只有作者知道的原因，GNU 汇编器始终将这个“寄存器本来应该是的零”表示为“%eiz”寄存器。英特尔语法只是删除了它。

回复收藏 0 原文

羁〃客ぐ 2024-09-02 21:39:47

安迪·罗斯提供了更多的基本推理，但不幸的是错误的，或者至少在技术细节上令人困惑。确实，仅 (%esp) 的有效地址不能仅使用 ModR/M 字节进行编码，而不是解码为 (%esp)，而是用于表示还包含 SIB 字节。然而，%eiz 伪寄存器并不总是与 SIB 字节一起使用来表示已使用 SIB 字节。

SIB 字节 (scale/index/base) 包含三个部分：索引（应用缩放的寄存器，例如 %eax 或 %ecx）、标度（索引寄存器乘以 1 到 8 的 2 的幂）和基址（添加到缩放索引的另一个寄存器）。这就是允许诸如 add %al,(%ebx,%ecx,2) 之类的指令（机器代码：00 04 4b -- 操作码、modr/m、 sib（注意，即使使用了 SIB 字节，也没有 %eiz 寄存器））（或者在 Intel 语法中，“add BYTE PTR [ecx*2+ebx], al”）。

但是，%esp 不能用作 SIB 字节中的索引寄存器。英特尔没有允许此选项，而是添加了一个按原样使用基址寄存器的选项，没有缩放或索引。因此，要消除 add %al,(%ecx) （机器代码：00 01 -- opcode, modr/m）和 add %al 的情况之间的歧义,(%ecx) （机器代码：00 04 21 -- 操作码、modr/m、sib），替代语法 add %al,(%ecx,%eiz ,1) 被改用（或者对于 Intel 语法：add BYTE PTR [ecx+eiz*1],al）。

正如 Sinan 链接的文章中所解释的，这条特定指令 (lea 0x0(%esi,%eiz,1),%esi) 仅用作多字节 nop（相当于 < code>esi = &*esi)，这样只需执行一条类似 nop 的指令，而不是执行多条 nop 指令。