通过网络运行 UPC 代码时出现问题:连接被拒绝

发布于 2024-10-12 18:24:31 字数 810 浏览 3 评论 0原文

当我在 2 个节点的网络上运行 UPC 代码时,启用 -v 选项以提供执行的详细信息,我注意到主节点 (glitch.rutgers.edu) 尝试连接到自身,而不是连接到它的相邻节点。

/usr/bin/rsh glitch.rutgers.edu -l sharatds -n '/usr/bin/env'
'GASNET_MAX_SEGSIZE='74344KB'' 'GASNET_VERBOSEENV='1'' '/cac/u01/sharatds/UPC_Tests/./upcMatrxMultplction_mpi' glitch.rutgers.edu 41449 \-p4amslave \-p4yourname glitch.rutgers.edu \-p4rmrank 1
    glitch.rutgers.edu: Connection refused
    p0_5078:  p4_error: Child process exited while making connection to remote process on glitch.rutgers.edu: 0
    p0_5078: (45.046875) net_send: could not write to fd=4, errno = 32
    gasnetrun: unlinking gasnetrun_mpi-temp-4813/rsh gasnetrun_mpi-temp-4813/ssh gasnetrun_mpi-temp-4813/mpirun-rsh gasnetrun_mpi-temp-4813/mpirun-tmp

为什么会出现这种情况?对配置的任何更改都应该设置正确吗?

感谢您的帮助

when I run a UPC code over a network of 2 nodes, with -v option enabled to give me detailed information of execution, I notice that the master node (glitch.rutgers.edu) tries to connect to itself as opposed to connect to it's neighbouring nodes.

/usr/bin/rsh glitch.rutgers.edu -l sharatds -n '/usr/bin/env'
'GASNET_MAX_SEGSIZE='74344KB'' 'GASNET_VERBOSEENV='1'' '/cac/u01/sharatds/UPC_Tests/./upcMatrxMultplction_mpi' glitch.rutgers.edu 41449 \-p4amslave \-p4yourname glitch.rutgers.edu \-p4rmrank 1
    glitch.rutgers.edu: Connection refused
    p0_5078:  p4_error: Child process exited while making connection to remote process on glitch.rutgers.edu: 0
    p0_5078: (45.046875) net_send: could not write to fd=4, errno = 32
    gasnetrun: unlinking gasnetrun_mpi-temp-4813/rsh gasnetrun_mpi-temp-4813/ssh gasnetrun_mpi-temp-4813/mpirun-rsh gasnetrun_mpi-temp-4813/mpirun-tmp

Why is this happening ? Any changes to the configuration should set this right ?

Thanks for your help

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

哆兒滾 2024-10-19 18:24:31

此错误可能来自 rsh...您可以通过尝试从主节点运行 rsh 命令回自身来确认这一点,例如“rsh glitch pwd”(我猜测这会提示您输入密码)。

this error is likely from rsh...you can confirm this by trying to run an rsh command from the master node back to itself like "rsh glitch pwd" (my guess is this will prompt you for a password).

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文