当前位置：文江博客话题详情

了解CPU高速缓存和高速缓存线

发布于 2024-10-17 16:01:20 字数 684 浏览 7 评论 0原文

我试图了解 CPU 缓存是如何运行的。假设我们有这个配置（作为示例）。

高速缓存大小 1024 字节
高速缓存行 32 字节
1024/32 = 32 条高速缓存行。
单个缓存行可以存储 32/4 = 8 个整数。

1) 根据这些配置，标签长度应为 32-5=27 位，索引大小为 5 位（2^5 = 缓存行中每个字节的 32 个地址）。

如果缓存总大小为 1024，缓存行数为 32，那么标签+索引存储在哪里？（还有4*32 = 128字节。）这是否意味着缓存的实际大小是1024+128 = 1152？

2) 如果本例中缓存行为 32 字节，这意味着每当 CPU 需要从 RAM 获取新字节时，就会在缓存中复制 32 字节。我是否正确地假设请求字节的缓存行位置将由其地址确定？

这就是我的意思：如果 CPU 在 [FF FF 00 08] 处请求字节，则可用的缓存行将填充从 [FF FF 00 00] 到 <代码>[FF FF 00 1F]。我们请求的单字节将位于位置[08]。

3) 如果前面的陈述是正确的，这是否意味着用于索引的 5 位在技术上是不需要的，因为无论如何所有 32 个字节都在缓存行中？

如果我有什么问题，请告诉我。谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

撩起发的微风 2024-10-24 16:01:20

缓存由数据和标签 RAM 组成，其排列方式是访问时间与效率和物理布局的折衷。你错过了一个重要的统计数据：方式（组）的数量。你很少有单向缓存，因为它们在简单模式下的表现非常糟糕。无论如何：

1）是的，标签占用额外的空间。这是设计妥协的一部分 - 您不希望它占总面积的很大一部分，以及为什么行大小不仅仅是 1 个字节或 1 个字。此外，索引的所有标记都是同时访问的，如果有大量方法，这可能会影响效率和布局。尺寸比您的估计稍大。通常还有一些额外的位来标记有效性，有时还有提示。更多的路和更小的行需要标签占据更大的部分，因此通常行很大（32+字节）而路很小（4-16）。

2）是的。一些缓存还执行“关键字优先”提取，从导致行填充的单词开始，然后提取其余部分。这减少了 CPU 等待其实际请求的数据的周期数。如果您错过写入，某些缓存将“直写”并且不会分配行，这避免了在写入之前必须先读取整个缓存行（这并不总是一个胜利）。

3) 标签不会存储低 5 位，因为不需要它们来匹配缓存行。它们只是索引到单独的行中。

维基百科有一篇关于缓存的文章，虽然有点激烈，但相当不错：http://en.wikipedia.org/wiki/CPU_cache - 请参阅“实施”。有一个图表显示了数据和标签是如何分割的。我认为每个人都应该学习这些东西，因为当您知道底层机器的实际功能时，您确实可以提高代码的性能。

回复收藏 0 原文

姐不稀罕 2024-10-24 16:01:20

缓存元数据通常不被视为缓存本身的一部分。它甚至可能不存储在 CPU 的同一部分中（它可能位于另一个缓存中，使用特殊的 CPU 寄存器等实现）。
这取决于您的 CPU 是否会获取未对齐的地址。如果它只获取对齐的地址，那么您给出的示例就是正确的。如果 CPU 获取未对齐的地址，则它可能会获取 0xFFFF0008 到 0xFFFF0027 范围。
即使缓存访问已对齐，索引字节仍然有用。这为 CPU 提供了一种引用高速缓存行中字节的速记方法，可以在其内部簿记中使用该字节。您可以通过了解与缓存行关联的地址和与字节关联的地址来获得相同的信息，但需要携带的信息要多得多。

不同的 CPU 实现缓存的方式非常不同。为了获得您问题的最佳答案，请提供有关您所讨论的特定 CPU（类型、型号等）的一些其他详细信息。

回复收藏 0 原文