Java 分析：java.lang.Object.hashCode 占用一半的 CPU 时间但从未显式调用

发布于 2024-09-07 03:19:04 字数 288 浏览 24 评论 0原文

我已经使用 -agentlib:hprof=cpu=samples 对我的多线程程序进行了基准测试并惊讶地在结果中发现以下行：

rank   self  accum   count trace method
   1 52.88% 52.88%    8486 300050 java.lang.Object.hashCode

我从未在程序中显式调用 hashCode() 。这可能是什么原因？如何了解这次“浪费”的根源以及是否正常？

谢谢，大卫

原文

I have been benchmarked my multihreaded program using -agentlib:hprof=cpu=samples
and was surprised to find the following line in the results:

rank   self  accum   count trace method
   1 52.88% 52.88%    8486 300050 java.lang.Object.hashCode

I never explicitly call hashCode() in my program.
What can be the reason for this? How can I understand the source for this time "waste" and whether it is normal or not?

Thanks,
David

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

伴我老 2024-09-14 03:19:04

您很可能非常频繁地使用 Map，例如 HashMap。

HashMap 使用hashCode 来分布对象。如果您使用具有此数据结构的许多对象，则正确实现 .equals 和 .hashCode 方法非常重要。

请参阅：Effective Java Item 8：当您覆盖 equals 时始终覆盖 hashCode

回复收藏 0 原文

葬シ愛 2024-09-14 03:19:04

您应该做的一件事是检查匹配的堆栈跟踪以查看谁在调用它；变化是它确实是HashMap。

但除此之外，我注意到 hprof 往往会大大高估对 hashCode() 的调用；我真的很想知道如何以及为什么。这是基于实际了解代码的粗略性能概况；我已经看到 50% 的 cpu 使用率（通过采样），几乎可以肯定它绝对不会花那么长时间。 hashCode() 的实现仅返回一个 int 字段，并且方法是最终的（在最终对象上）。
所以它基本上是某种分析器工件......只是不知道如何或为什么，或如何摆脱它。

回复收藏 0 原文

送舟行 2024-09-14 03:19:04

你可能是对的。我实际上可以放弃对随机访问功能的使用（您是这么称呼它的吗？），并且我不关心对象的顺序。我只需要能够添加对象然后迭代所有对象。另外，这确实是一个集合（我不需要多次使用同一个对象），但我也永远不会尝试多次添加它......我应该使用列表来代替（尽管我不关心顺序）？对于这样的集合，最有效的数据结构是什么？

HashSet 被实现为将键映射到自身的 HashMap，因此切换到 HashSet 在性能方面不会产生太大差异。

其他替代方案是 TreeSet 或（假设您的应用程序永远不会尝试插入重复项）List 类之一。如果您的应用程序支持 List，那么 ArrayList 或 LinkedList 将比 HashSet 或 TreeSet 更有效。

然而，您的应用程序将 50% 的时间花费在 hashCode 方法上，这非常可疑。除非调整哈希表的大小，否则每个 set 或 map 操作只能调用一次 hashCode 方法。因此，要么正在进行大量的地图/集合大小调整，要么您正在执行大量的集合添加操作。（据我所知，对象哈希码方法很便宜，因此每次调用的成本不应该成为问题。）

编辑