当前位置：文江博客话题详情

GC 花了三个小时才减少了 1.2GB 的堆，可能是什么原因？

发布于 2024-11-05 19:51:03 字数 768 浏览 1 评论 0原文

在我们的一台服务器中，垃圾收集花了近三个小时才尝试（成功）减少 1.2GB 堆内存。从 1.4GB 到 200MB。

在此期间，CPU 使用率很高，几乎达到 80-100%。可能是什么原因？我们有 4 个具有相同配置（JVM 设置、服务器配置、硬件、网络）的此类服务器，假设没有人对其进行任何更改，那么特定服务器运行 3 小时 GC 的原因可能是什么。

所有其他服务器的每次 GC 活动仅花费 5 到 10 分钟。

请附上 HP BAC 的图表以供您参考。显示我认为 GC 启动的时间以及 GC 停止的时间。

在此处输入图像描述

（正如 Stephen 指出的更结论性的发现）当服务器管理员回复我时提供这些信息：

需要登录才能够评论，你可以免费注册一个本站的账号。

白首有我共你 2024-11-12 19:51:03

这里没有太多数据可供使用，但我的直觉是：你正在交换。我们唯一一次看到 GC 时间达到如此高的水平是当您过度使用该框并且它正在分页到磁盘时。这可能会使性能下降一个数量级（或更多）。

您需要收集操作系统（以及可能的虚拟机管理程序，如果适用）交换统计数据来证明或反驳这一理论。

（我知道 CPU 时间比我预期的交换时间要长，但你永远不知道。）

如果你发布硬件配置、“java -version”信息和 JVM 命令行参数（例如：-Xmx和-Xms）来帮助缩小你真正运行的范围。

小…红帽 2024-11-12 19:51:03

您没有提供太多信息，但可能的原因可能是：

您的应用程序中存在错误；例如，具有某些相当特殊特征的内存泄漏，或者持续耗尽内存然后重新启动的任务。
意外或故意的拒绝服务攻击；例如，某些客户端不断重试过大的请求，每次都使用减小“问题大小”的参数。
具有某些特征的单个运行时间极长的请求。
Thrashing - 请参阅@Trent Gray-Donald 的回答。（如果您过度分配了内存，那么 GC 算法（涉及查看随机分散在许多页面上的大量对象）很可能会引发系统抖动。我只是不确定这是否会导致堆使用量像您一样逐渐下降正在看到。）
JVM 设置的病态组合。
您正在使用的特定 JVM 中的垃圾收集器中存在错误。
以上的一些组合。

这种问题需要获得 Oracle/Java 支持合同。

以下信息可能有助于诊断此问题：