随机访问大量对象（如哈希表）的建议

发布于 2024-12-23 07:52:43 字数 199 浏览 6 评论 0原文

我正在处理一些生成的数据文件（数百兆字节），其中包含多个 G 对象。我需要随机访问这些对象。我猜想，一个可能的实现可能是一个大的HashTable。我的程序是用 Java 编写的，java.util.HashMap 似乎无法处理这个问题（不知怎的，它非常慢）。有人可以推荐一个随机访问这些对象的解决方案吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

凉世弥音 2024-12-30 07:52:43

如果 HashMap 非常慢，那么两个最可能的原因如下：

hashCode() 和/或 equals(Object) 方法可能非常昂贵。例如，如果您使用数组或集合作为键，hashCode() 方法将在您每次调用它时访问每个元素，并且等于方法将对相等的键执行相同的操作。
您的键类可能有一个糟糕的 hashCode() 方法，该方法为程序使用的很大一部分（不同的）键提供相同的值。发生这种情况时，您会遇到许多键冲突，当哈希表变大时，这可能会严重影响性能。

我建议您在更改数据结构之前先看看这些可能性。

注意：如果“几个 G 对象”意味着数十亿个对象，那么您将很难将文件内容保存在内存中......除非您在具有 100 GB RAM 的计算机上运行此应用程序。我建议你做一些“粗略的”计算，看看你想做的事情是否可行。