nvidia GPU 上的内核真的有超时吗?

发布于 2024-10-19 03:20:06 字数 304 浏览 5 评论 0原文

寻找为什么我的内核产生奇怪的错误消息或仅“0”结果的答案我发现了这个 answer on SO 提到在 nvidia gpus 上运行的内核有 5 秒的超时?我在谷歌上搜索了超时,但找不到确认来源或更多信息。

你对此了解多少?

超时是否会导致运行时间较长的内核出现奇怪的行为?

谢谢!

searching for answers for why my kernels produce strange error messages or "0" only results I found this answer on SO that mentions that there is a timeout of 5s for kernels running on nvidia gpus? I googled for the timout but I could not find confirming sources or more information.

What do you know about it?

Could the timout cause strange behaviour for kernels with a long runtime?

Thanks!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

怼怹恏 2024-10-26 03:20:06

进一步谷歌搜索在 CUDA_Toolkit_Release_Notes_Linux.txt(已知问题):

# 在连接显示器的 GPU 上,单个 GPU 程序启动的运行时间限制为少于 5 秒。超过此时间限制通常会导致通过 CUDA 驱动程序或 CUDA 运行时报告启动失败。未连接显示器的 GPU 不受 5 秒运行时间限制。因此,建议 CUDA 在未连接到显示器且未在其上扩展 Windows 桌面的 GPU 上运行。在这种情况下,系统必须至少包含一个 NVIDIA GPU 作为主图形适配器。

[更新] 这个功能的官方名称似乎是“看门狗”。

Further googling brought up this in the CUDA_Toolkit_Release_Notes_Linux.txt (Known Issus):

# Individual GPU program launches are limited to a run time of less than 5 seconds on a GPU with a display attached. Exceeding this time limit usually causes a launch failure reported through the CUDA driver or the CUDA runtime. GPUs without a display attached are not subject to the 5 second runtime restriction. For this reason it is recommended that CUDA be run on a GPU that is NOT attached to a display and does not have the Windows desktop extended onto it. In this case, the system must contain at least one NVIDIA GPU that serves as the primary graphics adapter.

[update] It seems that the official name for this feature is 'watchdog'.

桃扇骨 2024-10-26 03:20:06

如果您使用的是 Windows Vista 或更高版本,WDDM 驱动程序堆栈将在大约两秒后自动重置设备,除非您 调整您的 TDR 超时。 (Windows 无法区分运行较长内核的 GPU 和锁定的 GPU 之间的区别。)在 TCC 模式下运行的 Tesla 品牌卡不受正常显示适配器的限制,因此可以运行更长的内核。

If you're on Windows Vista or later, the WDDM driver stack will automatically reset the device after about two seconds unless you tweak your TDR timeouts. (Windows can't tell the difference between a GPU running a lengthy kernel and a GPU that's locked up.) Tesla-branded cards running in TCC mode aren't subject to the normal display adapter restrictions and can therefore run longer kernels.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文