cuda 视觉分析器中的 CPU 和 GPU 计时器

发布于 2024-10-06 14:31:16 字数 289 浏览 1 评论 0原文

所以cuda Visual Profiler中有2个定时器，

GPU Time：它是GPU上方法的执行时间。 CPU时间：它是启动该方法的GPU时间和CPU开销的总和。在驱动程序生成的数据级别，CPU 时间只是启动非阻塞方法的 CPU 开销；对于阻塞方法，它是 GPU 时间和 CPU 开销的总和。默认情况下，所有内核启动都是非阻塞的。但是，如果启用了任何探查器计数器，内核启动就会被阻止。不同流中的异步内存复制请求是非阻塞的。

如果我有一个真正的程序，实际执行时间是多少？我测量时间，还有GPU定时器和CPU定时器，有什么区别？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

德意的啸 2024-10-13 14:31:16

您已经快完成了 - 现在您已经了解了一些不同的选项，最后一步是问自己到底要测量什么时间。这个问题没有正确的答案，因为这取决于您想要通过测量来做什么。当您尝试优化计算时，CPU 时间和 GPU 时间正是您想要的，但它们可能不包括等待等实际上非常重要的事情。你提到“实际执行时间”——这是一个开始。你的意思是问题的完整执行时间——从用户启动程序到吐出答案并程序结束？在某种程度上，这确实是唯一真正重要的时间。

对于这样的数字，在 Unix 类型的系统中，我喜欢只测量程序的整个运行时间； /bin/time myprog，大概有一个 Windows 等效项。这很好，因为它完全不夸张。另一方面，因为它是一个总体，所以它太宽泛了，没有什么帮助，而且如果你的代码有一个大的 GUI 组件，那就没什么好处了，因为这样你还要测量用户点击他们的方式所花费的时间到结果。

如果您想要某些计算集的运行时间，cuda 有非常方便的函数 cudaEvent*，可以将其放置在代码的各个部分 - 请参阅 CUDA 最佳实践指南，第 2.1.2 节，使用 CUDA GPU 计时器 — 您可以将这些计时器放在重要的代码之前和之后并打印结果。

回复收藏 0 原文