Anaconda Xgboost 无法找到 GPU
Anaconda 似乎无法识别我的 GPU, GPU为RTX2070(驱动版本510.47.03), 系统Ubuntu 20.04, cuda工具包11.3.1, cudnn 8.2.1, 通过 pip 安装 XGboost 1.5.2。
当我在启用 GPU 的情况下运行 XGboost 时,它显示:
XGBoostError: [01:24:12] ../src/gbm/gbtree.cc:531: Check failed: common::AllVisibleGPUs() >= 1 (0 vs. 1) ) :未找到 XGBoost 的可见 GPU。
我还使用 GPUtil 检查可见 GPU,它显示 0 GPU。
以下是 nvidia-smi
有人可以帮忙吗?为什么系统中的 GPU 对 anaconda 中的任何包都不可见? (Pytorch、XGBoost 等)
It seems that Anaconda is unable recognise my GPU,
GPU is RTX2070 (Driver version 510.47.03),
system Ubuntu 20.04,
cudatoolkit 11.3.1,
cudnn 8.2.1,
XGboost 1.5.2 via pip install.
When I run XGboost with GPU enable it shows:
XGBoostError: [01:24:12] ../src/gbm/gbtree.cc:531: Check failed: common::AllVisibleGPUs() >= 1 (0 vs. 1) : No visible GPU is found for XGBoost.
I also used GPUtil to check the visible GPU, it is showing 0 GPU.
Below is the output from nvidia-smi
Can anyone help? how come the GPU in the system is no visible to any package in anaconda? (Pytorch, XGBoost etc.)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
似乎是驱动程序问题,在另一台具有两个 RTX 3090 的计算机上尝试了相同的代码,但没有问题
Appeared to be a driver issue, tried the same code in another computer with two RTX 3090 and got no issue
当在具有旧显示驱动程序库(针对旧 CUDA 版本构建)的系统中安装不匹配(通常是较新的)CUDA Toolkit 时,XGBoost 会引发此错误。
需要通过以下两种方式之一来同步驱动程序库(在主机上)和 CUDA Toolkit(在容器中)之间的 CUDA 版本:
这是我遇到此错误时的情况:链接。
This error is raised by XGBoost when a mismatched (typically newer) CUDA Toolkit is installed in a system with older display driver libraries (build for an older CUDA version).
One needs to synchronize CUDA versions between the driver libraries (on the host) and CUDA Toolkit (in the container), by either of two things:
Here's my scenario when I encountered this error: link.