新的 Haswell AVX“聚集”有哪些对齐限制?指示?

发布于 2024-11-18 04:24:51 字数 547 浏览 2 评论 0原文

我正在查看 AVX 编程参考新的 Haswell 指令 包括一些期待已久的“收集”负载。但是,我无法弄清楚索引数据项的对齐限制是什么。参考文献的第 2.5 节“内存对齐”似乎应该在表 2.4 或 2.5 之一中列出各种 VGATHER* 指令...但事实并非如此。

背景:虽然收集指令支持的数据大小为 4 和 8 字节,但我的应用程序可以从将相邻 16 位数据值对收集加载到 DWORD 中受益。具有 2 字节标度的奇数索引将产生 2 字节对齐的 4 字节负载,并且从手册中我不清楚这是否会出错或无法按预期工作(我宁愿怀疑我运气不好,因为所有支持未对齐访问的指令似乎有一个“U”)。

I'm looking at the AVX programming reference. The new Haswell instructions include some eagerly awaited "gather" loads. However, I can't figure out what the alignment restrictions are on the indexed data items. Section 2.5 "Memory alignment" of the reference seems like it ought to list the various VGATHER* instructions in one of tables 2.4 or 2.5... but it doesn't.

Background: while gather instructions' supported data sizes are 4 and 8 bytes, my application could benefit from gather-loading adjacent 16-bit data value pairs to DWORDS. Odd indices with a 2-byte scale will produce 2-byte aligned 4-byte loads and it's not clear to me from the manual whether this will fault or otherwise fail to work as intended (I rather suspect I'm out of luck given all the instructions supporting unaligned accesses seem to have a 'U' in them).

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

各空 2024-11-25 04:24:51

这是我第一次听说 AVX2。但我猜测内存对齐限制与当前在 Sandy Bridge 上使用新的 VEX 编码方案实现 AVX 没有什么不同。即不需要对齐,除非显式使用名称中带有 A 的对齐 VMOV 指令。大多数指令允许以任何字节粒度对齐进行访问。

事实上,请参阅英特尔(R) 高级矢量扩展编程参考第 35 页第 2.5 节,其中指出正是这个。

This is the first time I hear about AVX2. But I'm guessing the memory alignment restriction won't be different from current implementation of AVX on Sandy Bridge with the new VEX coding scheme. I.e. no alignment required unless explicitly using aligned VMOV instruction with A in the name. Most instruction allow access with any byte-granularity alignment.

In fact, see section 2.5, page 35 of Intel(R) Advanced Vector Extensions Programming Reference which states exactly this.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文