推荐用于 Java 实现的低内存哈希图

发布于 2024-08-23 21:27:18 字数 461 浏览 2 评论 0原文

我目前正在研究一个与编程相关的问题，我试图制作一个大量的数据哈希图。数据的关键是 CharSequence 的自定义低内存实现，它实现了 hashCode() 和 equals(...)，值是 Integer 对象。

这个哈希表中可能有数百万个条目，我通过让整数成为文件中指向我希望哈希的数据的指针，设法大幅减少该值的内存使用，但问题是键可能是数十个字节（平均 25 个字节），并且在 HashMap 的默认实现中，键需要保存在内存中。

我需要一个内存开销较低的哈希图，并且可以将键分页到磁盘或存储键的哈希表示。如果密钥本身经过哈希处理，那么我会担心哈希冲突。

理想情况下，我希望能够在每 50MB 堆空间的映射中存储一百万个条目（键中包含 25 个字节的一个字节数组，值部分中包含 Integer 对象）。

有没有人有过使用低内存文件系统支持的地图的经验，这些地图经过优化以减少密钥的占用空间？

谢谢，

克里斯

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

℉服软 2024-08-30 21:27:18

您可以使用 Java 的哈希映射并编写一个 FileKey 类，该类采用 RandomAccessFile、偏移量和长度，在构造时预先计算哈希，并通过从文件中读取数据来实现 Comparable 以便进行比较。

与简单的 MRU 缓存结合使用，您可以使用另一个哈希图在内存中保留一定数量的键，该哈希图以相同的键为键，但它使用自定义比较器，仅比较偏移量和长度值（而不是文件数据）。

回复收藏 0 原文

百善笑为先 2024-08-30 21:27:18

Berkeley DB Java 版怎么样？它的 StoredMap课程看起来像您正在寻找的课程。

回复收藏 0 原文

烈酒灼喉 2024-08-30 21:27:18

我认为默认的 HashSet 并不是一个坏方法——自己创建键值对（这样你就不必将它们包装在额外的对象中）。这样可以非常节省内存；它实际上只需要在关键对象之上增加大约 (1/loadFactor)^(3/2)*4 个字节的内存 + 4 个字节的值。实际上，这应该为每个条目增加 8 个字节的开销。（如果您事先知道要存储多少个密钥，则可以进一步减少此值。）

回复收藏 0 原文

~没有更多了~