java：非常大的树？

发布于 2024-12-02 15:05:49 字数 408 浏览 0 评论 0原文

目标是建造非常大的树。我所说的“非常大”是指数亿个节点，相当于几千兆字节。

问题是通用数据结构的开销太大。我买不起“节点”对象和子“地图”。我需要以非常紧凑的方式将其直接编码到内存中。

因此，我想知道是否存在一些以整数作为键和值的内存有效实现树，而不在内部使用对象，因此需要（4字节键+4字节值+4字节子索引+一些免费字节哈希空间 = 每个条目平均 15 个字节），这将允许我使用外部映射 int<->keys 和 int<->values 来搜索树。

有人吗？

PS：内部使用对象至少使用5倍的空间：8个引用+4个额外哈希空间+16个对象头+8个键引用+8个值引用+8个父引用+8个子引用+子映射obj的(16+x) = 每个条目近 76+x 字节。（例如，我们的默认实现每个条目需要大约 100 个字节）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

等待我真够勒 2024-12-09 15:05:49

这实际上不是 Java 特定的问题，而是一个普遍的概念。

试试这个： http://webdocs.cs.ualberta.ca /~holte/T26/tree-as-array.html

关键是使用基元数组，以避免对象开销。

回复收藏 0 原文

緦唸λ蓇 2024-12-09 15:05:49

我不知道有任何特定的树实现可以完全做到这一点，但 VTD-XML 在内部使用带有指向缓冲区的指针的标记数组来表示 XML 树（DOM）。也许您可以从他们的解决方案中获得启发？

回复收藏 0 原文

时光礼记 2024-12-09 15:05:49

您可能会发现这个库可以帮助您实现您想要的 - 它是专门为将值存储为基元而设计的，并且在幕后进行了一些字节码黑客操作以给出存储对象的错觉。当...时使用它

...您希望在内存中有效地存储大量数据。该库可以显着减少 Full GC 时间并减少内存消耗。

它没有特定的 Tree 集合，但它可能会起作用，具体取决于您的需要。

http://code.google.com/p/vanilla-java/wiki/HugeCollections

回复收藏 0 原文

孤独岁月 2024-12-09 15:05:49

我认为您不会找到任何已经为您实现的内容，但是您所描述的内容可以使用 IntBuffer。您将创建一个“包装器”类，将索引转换为缓冲区中的记录，并根据需要实例化/丢弃这些包装器（即，当您遍历树时，您可能不关心关于保留对父级的引用）。

有几个问题：

包装器实例的垃圾收集：只要它们是短暂的，它们就永远不会离开 Eden，因此 GC 几乎是免费的。
缓冲区内记录的垃圾收集：如果您有一个一次性写入树，那么这没有问题。否则，您需要维护一个空闲列表。不难，但需要一些时间。
实现树的一般机制：这已经通过 TreeMap 等类为您完成了。但算法非常简单，可以从 Wikipedia 获取。

回复收藏 0 原文

空心空情空意 2024-12-09 15:05:49

每个节点都可以拥有对其父节点的引用，而不是保留子节点列表。因此，序列化节点不需要三个以上的整数值（父节点、键、值）。

这种方法的一个问题是树遍历。获得所有节点子节点的明确列表需要迭代所有节点。如果三元组按其父值排序，则可以改进遍历。再添加一个整数值，即指向下一个键的指针，将允许将节点保留在链表中，从而简化节点插入和删除的工作。

回复收藏 0 原文

~没有更多了~

关于作者

末蓝

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

java：非常大的树？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

燃烧我的卡路李先生

qq_2gSKZM

∞梦里开花

qq_IklFPL

迷途知返

深海不蓝

友情链接

java：非常大的树？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

燃烧我的卡路李先生

qq_2gSKZM

∞梦里开花

qq_IklFPL

迷途知返

深海不蓝

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。