当前位置：文江博客话题详情

现代 Intel 或 AMD CPU 上的分散写入速度与分散读取速度？

发布于 2024-09-06 09:52:36 字数 366 浏览 11 评论 0原文

我正在考虑通过采用线性数组并将每个元素写入另一个数组中的任意位置（从 CPU 的角度来看是随机的）来优化程序。我只进行简单的写入，而不读回元素。

据我所知，传统 CPU 的分散读取可能会非常慢，因为每次访问都会导致缓存未命中，从而导致处理器等待。但我认为分散写入在技术上可能会很快，因为处理器不等待结果，因此它可能不必等待事务完成。

不幸的是，我不熟悉经典 CPU 内存架构的所有细节，因此可能会出现一些复杂情况，导致速度也相当慢。

有人试过这个吗？

（我应该说我正在尝试解决我遇到的问题。我目前有一个线性数组，我可以从中读取任意值 - 分散读取 - 并且由于所有缓存未命中而速度非常慢。我的想法是我可以将此操作反转为分散写入，以获得显着的速度优势。）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

恍梦境° 2024-09-13 09:52:36

一般来说，对尚未在缓存中的地址进行分散写入会付出高昂的代价，因为每次写入都必须加载和存储整个缓存行，因此 FSB 和 DRAM 带宽要求将比顺序写入高得多。当然，每次写入都会导致缓存未命中（现代 CPU 上通常会发生几百个周期），并且任何自动预取机制都没有帮助。

回复收藏 0 原文

私野 2024-09-13 09:52:36

我必须承认，这听起来有点硬核。但我还是冒着风险回答。

是否可以将输入数组分为多个页面，并多次读取/扫描每个页面。每次浏览页面时，您仅处理（或输出）属于有限数量页面的数据。这样，您只会在每个输入页面循环开始时出现缓存未命中。

回复收藏 0 原文

~没有更多了~

关于作者

故事与诗

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

现代 Intel 或 AMD CPU 上的分散写入速度与分散读取速度？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚守退让之实

小兔几

mb_3y7WUgWY

友情链接

现代 Intel 或 AMD CPU 上的分散写入速度与分散读取速度？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

知足的幸福

我一向站在原地

慕烟庭风

秉忠贞之诚 守退让之实

小兔几

mb_3y7WUgWY

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

秉忠贞之诚守退让之实