当前位置：文江博客话题详情

预取对齐内存

发布于 2024-11-17 05:34:15 字数 149 浏览 6 评论 0原文

我有一些线程 C 代码，需要对处理后的数据结构进行 64 字节对齐。这种对齐将如何与 gcc __builtin_prefetch 等预取指令交互？预取的效果与使用非对齐数组的效果是否相同？

请注意，我使用 memalign 来获取对齐的数组。

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

热风软妹 2024-11-24 05:34:15

这个问题的答案高度依赖于实现。

但是，在 x86 和 x86_64 上，GCC 将 __builtin_prefetch 实现为单个 PREFETCH 汇编指令。

根据英特尔文档（搜索“PREFETCH”）：

从内存中获取包含源指定字节的数据行
操作数指向由位置提示指定的缓存层次结构中的位置：

我 99% 确定 AMD 版本的行为方式相同，但我太忙而无法检查...

因此，如果内存操作数未对齐，它将有效地四舍五入减少到 64 字节的倍数，并且该缓存行将被预取。（嗯，我知道的所有当前 CPU 上都是 64 字节。指令集引用仅保证“至少 32 字节”。不知道他们为什么要这么说；在任何使用这个小工具有意义的情况下，您必须已经对特定 CPU 做出了很多假设。）

回复收藏 0 原文

~没有更多了~

关于作者

北方。的韩爷

暂无简介

文章

26 人气

关注发私信

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

友情链接

文江博客

预取对齐内存

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签