如何调试大型服务器端分布式Java应用程序

发布于 2024-10-02 17:14:03 字数 331 浏览 1 评论 0原文

这是我的问题：我正在尝试调试 Apache Cassandra 并了解应用程序的流程。即当客户端发送请求时，例如 put()，调用哪些方法以及系统内部如何工作。

所以，这就是我的想法：

在 cassandra 代码中编写一个 main 方法，该方法调用入口点 put() 方法，在 eclipse 等中放置断点等，或者
不要编写 main 方法，只需使用常规客户端（它访问通过 TCP 服务器）和使用 log4j 记录器（已在 cassandra 中实现）“调试”（通过读取日志文件并理解代码）。

所以，我的问题是，调试此类分布式应用程序的理想方法是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

虚拟世界 2024-10-09 17:14:03

理想的方式？两者兼而有之，甚至更多。

您提到了目标：“调试”和“理解应用程序的流程” - 好吧，在理解流程之前很难进行调试，但理解本身可能就是目的。

在现实世界中，在处理大型分布式系统时通常不能依赖调试器，至少在最初是这样，尤其是因为有些问题仅在系统繁忙或运行数小时后才会出现。因此，在应用程序代码和基础设施代码中良好的调试跟踪以及对该跟踪的细粒度控制至关重要。

但是，如果您有机会在调试器中运行，这可能会很有启发。

在这一切之前，我认为你需要：

a）。研究可能存在的任何设计文档。

b).在一个好的 IDE 中浏览源代码，例如。蚀。只要跟着控制走就可以了。嗯，这里有一个有趣的地方，想知道它是从哪里调用的？调用类上的该方法，它有什么作用？该构造函数什么时候被调用？

有了这些，跟踪跟踪就容易多了，并且您可以更好地知道在哪里放置断点。

回复收藏 0 原文

黑寡妇 2024-10-09 17:14:03

如何使用log4j的MDC，设置正确在 put() 之前，然后在 put() 退出后清除它？然后，您可以看到其中到底发生了什么，只要您在 put() 内执行的方法中设置了其他日志记录。如果您在该方法中深处，请时不时地记录堆栈跟踪，以便您可以看到当前所在的位置。

免责声明：我的调试优先级列表如下：

检查堆栈跟踪
检查日志文件
使用调试器

因此，如果 1. 和 2. 没有给我答案，我将诉诸调试器。

在这样的分布式应用程序中，使用调试器听起来像是最后的手段。

回复收藏 0 原文

把时间冻结 2024-10-09 17:14:03

在分布式应用程序中使用日志记录确实是了解更广泛范围内实际发生的情况以及事物如何交互的最佳方法之一。但您最终将面临日志文件的问题 - 分布式系统可以生成大量不同格式和位置的日志文件。因此，如果您想使用 log4j （或类似的）来完成类似的事情，您应该将日志聚合到一个地方，然后研究它们。这个工具可能会有所帮助， - 它不仅允许持久聚合，还可以实时监控来自各种不同的聚合日志流来源。例如，您可以关注特定主机（或主机范围）的数据层并实时观察正在发生的情况。或者，您可以从特定机器上的特定线程获取日志，或者使用 MDC 上下文，如上一张海报中已经提到的。我也同意这样的观点：分布式应用程序中的调试器在大多数情况下都是无用的，并且出于明显的原因在生产系统中完全无用。另一方面，Log4j 非常灵活，使用广泛，并且是最好的日志记录工具之一（恕我直言）。

回复收藏 0 原文