DCGM错误:无法建立与指定主机的连接:localhost

发布于 2025-02-12 20:54:41 字数 431 浏览 1 评论 0 原文

我正在使用AWS,我的环境是:

  • AMI:深度学习AMI GPU CUDA 11.4.1(Ubuntu 18.04)20211204
  • G4DN.xlarge实例(T4)

和安装DCGM,请参阅此链接 https://developer.nvidia.com/dcgm (该版本已从Ubuntu20修改为18并安装)

安装DCGM后,当我输入该语句时,我会收到以下错误

错误:无法建立与指定主机的连接:localhost
错误:无法连接到主机引擎。主机引擎连接无效/断开连接。

I'm using aws and my environment is:

  • AMI : Deep Learning AMI GPU CUDA 11.4.1 (Ubuntu 18.04) 20211204
  • g4dn.xlarge instance (T4)

and install DCGM refer to this link https://developer.nvidia.com/dcgm
(The version was modified from ubuntu20 to 18 and installed)

after install DCGM, When I enter that statement, I get the following error

Error: unable to establish a connection to the specified host: localhost
Error: Unable to connect to host engine. Host engine connection invalid/disconnected.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

似狗非友 2025-02-19 20:54:41

设置DCGM服务

$ sudo systemctl-现在启用nvidia-dcgm

Set up the DCGM service

$ sudo systemctl --now enable nvidia-dcgm

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文