调试“ mem_used_percent”在EC2实例上

发布于 2025-02-09 08:09:47 字数 340 浏览 2 评论 0原文

在EC2实例上运行的AWS服务中,我们面临着一个奇特的问题。在CW指标中,“ mem_used_percent”逐渐上升,最终达到90%,随后是系统故障。我们已经验证了由于OOM错误而发生的故障,并且重新启动主机正在通过将“ mem_used_percent”下降到20%左右来修复它。

在对新运行的EC2实例进行调查时,我们看到在“ TOP”命令输出(按%MEM)中仅考虑了大约20%的RAM使用情况。我们无法使用未算出的物理内存实际上固定过程。

是否有更好的方法对EC2实例(Linux)进行内存使用分析,以总结到CW指标中的“ mem_used_percent”?

请让我知道是否需要其他细节。

谢谢!!

We are facing a peculiar issue in our AWS service running on EC2 instances. In CW metrics "mem_used_percent" is gradually going up with time and eventually goes to 90% followed by system failure. We have verified that failure is happening due to OOM error and restarting the hosts is fixing it by bringing the "mem_used_percent" down to around 20%.

While doing the investigation on new and old running EC2 instances, we are seeing that only around 20% of the RAM usage is accounted for in "top" command output(sort by %MEM). We are not able to actually pin-point the processes using rest of the unaccounted physical memory.

Is there a better way to do memory usage analysis on EC2 instances(Linux) that will sum up to "mem_used_percent" in CW metrics?

Please let me know if any other details are required.

Thanks!!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文