nvidia GPU 上的内核真的有超时吗?
寻找为什么我的内核产生奇怪的错误消息或仅“0”结果的答案我发现了这个 answer on SO 提到在 nvidia gpus 上运行的内核有 5 秒的超时?我在谷歌上搜索了超时,但找不到确认来源或更多信息。
你对此了解多少?
超时是否会导致运行时间较长的内核出现奇怪的行为?
谢谢!
searching for answers for why my kernels produce strange error messages or "0" only results I found this answer on SO that mentions that there is a timeout of 5s for kernels running on nvidia gpus? I googled for the timout but I could not find confirming sources or more information.
What do you know about it?
Could the timout cause strange behaviour for kernels with a long runtime?
Thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
进一步谷歌搜索在 CUDA_Toolkit_Release_Notes_Linux.txt(已知问题):
[更新] 这个功能的官方名称似乎是“看门狗”。
Further googling brought up this in the CUDA_Toolkit_Release_Notes_Linux.txt (Known Issus):
[update] It seems that the official name for this feature is 'watchdog'.
如果您使用的是 Windows Vista 或更高版本,WDDM 驱动程序堆栈将在大约两秒后自动重置设备,除非您 调整您的 TDR 超时。 (Windows 无法区分运行较长内核的 GPU 和锁定的 GPU 之间的区别。)在 TCC 模式下运行的 Tesla 品牌卡不受正常显示适配器的限制,因此可以运行更长的内核。
If you're on Windows Vista or later, the WDDM driver stack will automatically reset the device after about two seconds unless you tweak your TDR timeouts. (Windows can't tell the difference between a GPU running a lengthy kernel and a GPU that's locked up.) Tesla-branded cards running in TCC mode aren't subject to the normal display adapter restrictions and can therefore run longer kernels.