Ropes：什么“足够大以从缓存效应中受益”？

发布于 2024-08-02 21:27:45 字数 675 浏览 2 评论 0原文

来自维基百科：

主要缺点比较大整体空间使用率较慢索引，两者都变得更加随着树结构变得严重更大更深。然而，许多索引的实际应用仅涉及迭代字符串，只要叶节点足够大受益于缓存效果。

我正在绳索和绳子之间实现某种折衷。基本上它只是绳索，除了当连接的字符串很短时我将连接对象压平为字符串。这样做有几个原因：

当连接的字符串很短时（以正常形式连接两个字符串不需要太长时间），连接对象的好处很小。
这样做可以减少树的大小/深度（减少绳索的缺点）。
这样做会增加叶节点的大小（以更好地利用缓存）。

然而，随着长度变长，绳索的优势也会减少，所以我想找到一些折衷方案。从逻辑上讲，“最佳点”似乎位于“叶节点足够大以从缓存效应中受益”的地方。问题是，我不知道它有多大。

编辑：当我写这篇文章时，我想到理想的大小是缓存页面的大小，因为这样绳索只会在字符串中发生缓存未命中时导致缓存未命中。所以我的第二个问题是，这个推理正确吗？有没有跨平台的方法来检测缓存页面的大小？

我的目标语言是C++。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

嘴硬脾气大 2024-08-09 21:27:45

绳状字符串的极限情况将构建在 std::list 之上。这显然不是很有效。迭代时，每个“叶子”/字符可能有一次缓存未命中。随着每个叶子的字符数增加，平均未命中数会下降，一旦叶子分配超过单个缓存行，就会出现不连续性。

拥有更大的叶子可能仍然是个好主意；缓存层次结构中的内存传输可能在不同级别具有不同的粒度。此外，当针对一组混合 CPU（即消费者 PC）时，叶子大小（2 的较高幂）将是更多机器上高速缓存行大小的整数倍。例如，如果您要使用 16 和 32 字节高速缓存行来寻址 CPU，则 32 字节将是更好的选择，因为它始终是整数数量的高速缓存行。浪费半个缓存行是一种耻辱。

回复收藏 0 原文

~没有更多了~