如何使用X86平台上使用GCC声明内存范围为无法摄取的内存范围？

发布于 2024-12-04 14:39:57 字数 133 浏览 3 评论 0原文

虽然我已经阅读了有关此的 movntdqa 指令，但已经找到了一种干净的方法来表示不可缓存的内存范围或读取数据，以免污染缓存。我想从海湾合作委员会做到这一点。我的主要目标是交换到大型数组中的随机位置。由于数据恢复很少，希望通过避免缓存来加速此操作。

需要登录才能够评论，你可以免费注册一个本站的账号。

许你一世情深 2024-12-11 14:39:57

我认为您所描述的是内存类型范围寄存器。您可以在 Linux 下使用 /proc/mttr / ioctl(2) 控制这些（如果可用并且您是用户 0），请参阅此处为例。由于它在物理地址范围上工作，我认为您将很难以合理的方式使用它。

更好的方法是查看 GCC 提供的编译器内在函数并找到一个或更多，表达您的意图。查看 Ulrich Drepper 的系列“每个程序员都应该了解内存”，特别是第 5 部分它涉及绕过缓存。看起来 _mm_prefetch(ptr, _MM_HINT_NTA) 可能适合您的需求。

一如既往，当谈到绩效时——衡量、衡量、再衡量。 Drepper 的系列有精彩的部分详细介绍了如何做到这一点（第 7 部分）以及代码示例和其他内容加快代码的内存性能时可尝试的策略。

眼泪都笑了 2024-12-11 14:39:57

来自用户786653的所有好建议；尤其是 Ulrich Drepper 的文章。我要补充一点：

无论是否未缓存，VM 硬件都必须在 TLB 中查找页面信息，而 TLB 的容量有限。不要低估 TLB 抖动对随机访问性能的影响。如果您还没有，请查看结果这里了解为什么你真的想使用用于数组数据的大页面，而不是微小的 4K 默认值（这可以追溯到“640K 对任何人来说都应该足够了”的时代）。当然，如果你说的是真正巨大的数组，甚至比充满 2MB 页面的 TLB 可以引用的还要大，即使这样也无济于事。
您对“nt”指令（例如_mm_stream_ps内在指令）有什么看法？我不相信声明页面未缓存会比适当使用这些页面带来更好的性能，而且它们比其他替代方案更容易使用。不过，我很想看到相反的证据。