返回介绍

如何debug

发布于 2024-06-23 17:58:49 字数 1038 浏览 0 评论 0 收藏 0

经过并行修饰符修饰的类,并没有在本地运行,而是跑在了集群上,相应地,我们也没法在本机上看到打印的log,比如之前的代码。

import parl

@parl.remote_class
class Actor(object):
  def hello_world(self):
      print("Hello world.")

  def add(self, a, b):
      return a + b

# connect to master node in cluster
parl.connect("localhost:6006")

actor = Actor()
actor.hello_world()# because we are running on the cluster so this line will print nothing

这种情况下,我们应该怎么debug,定位问题呢? 这里推荐两个方案:

  • 注释并行修饰符 : 先不在集群上跑并行,而是在本地跑起来,根据输出的日志debug,调试通过后再增加并行修饰符。但是这种方法在静态图的神经网络框架中可能会引发静态图重复定义的问题,在使用静态图版本paddle或者tensorflow的时候不建议采用这种方法。

  • 根据xparl的日志服务查看 :在本地脚本连接到xparl集群之后,xparl会在程序中输出logserver的地址,通过浏览器访问这个网站即可实时查看每个并行任务的对应输出。

https://www.wenjiangs.com/wp-content/uploads/2024/docimg5/log_server.png

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文