当前位置：文江博客话题详情

忽略缓存的数据结构和动态语言 - 有效吗？

发布于 2024-08-18 10:06:12 字数 210 浏览 10 评论 0原文

我最近一直在阅读有关缓存无关的数据结构（例如辅助缓冲区堆）的内容。这些数据结构的工作原理是将最近访问的元素保留在高速缓存中，因此任何后续访问也会更快。

大多数这些数据结构都是用 C/C++ 等低级语言实现的。尝试将这些数据结构移植到 Python 这样的动态语言是否值得，或者在虚拟机上运行的开销是否会破坏这些数据结构的所有性能优势？似乎是后者，但我想我应该问问是否有人确实有这方面的经验。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

﹏半生如梦愿梦如真 2024-08-25 10:06:12

在 C（或 C++）中，您可以对每个数据结构的确切大小进行细粒度控制。您还可以对存储分配进行细粒度控制。毕竟，您可以扩展 new 方法，直接使用 malloc 或结构内存来创建空间局部性。

在大多数动态语言（如 Python）中，您根本无法控制任何内容的确切大小，更不用说它的位置了。

在Python中，你可能有一些时间局部性，但你几乎没有或没有空间局部性。

时间局部性可以通过简单的结果记忆来增强。这是一种常见的加速，人们经常使用记忆化装饰器来将记忆化（时间局部性）与核心算法分开。

我不认为 C 或 C++ 忽略缓存的实现可以转换为动态语言，因为我认为您没有足够的控制权。相反，只需利用记忆来加速。

http://wiki.python.org/moin/PythonDecoratorLibrary#Memoize

回复收藏 0 原文

森林迷了鹿 2024-08-25 10:06:12

缓存不经意算法的要点之一是对象的大小并不重要（因为无论如何你都不知道下一级内存分页的大小），因此无法知道确切的大小并不重要。在某些时候，超过 1 个对象的大小“适合”下一个内存块大小。（注意：不知道对象的大小对于缓存感知实现来说是一个重大问题）。

此外，大多数虚拟机内存分配器将在生成空间的末尾进行分配，因此只要您同时分配所有对象，就可以正常开始。不幸的是，一些缓存无关算法假设您可以更改内存布局，而这对于虚拟机来说通常是不可能的。

另一个大问题是，大多数基于 VM 的实现都使用对象的引用。因此，一个包含三个字符串的对象实际上是 4 个对象（对象本身和 3 个字符串对象）。除非这四个对象彼此相邻分配，否则算法的分析就会失败。

再加上虚拟机可以自由执行的压缩垃圾收集器和其他“优化”，您所需的控制与这些算法的当前研究状态之间存在巨大差距。

回复收藏 0 原文

~没有更多了~

关于作者

自控

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

忽略缓存的数据结构和动态语言 - 有效吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

忽略缓存的数据结构和动态语言 - 有效吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。