当前位置：文江博客话题详情

gpu cuda benchmarking

GPU编程——传输瓶颈

发布于 2024-08-25 00:48:30 字数 593 浏览 5 评论 0原文

由于我希望 GPU 为我做一些计算，因此我对测量“纹理”上传和下载速度的主题感兴趣 - 因为我的“纹理”是 GPU 应该处理的数据。

我知道从主内存传输到 GPU 内存是首选方式，因此我预计只有在需要处理大量数据且读回的结果很少的情况下，此类应用程序才会高效。

不管怎样，有这样的基准应用程序吗？我的意思是，为了测量主内存<>GPU传输吞吐量...

编辑（问题澄清）：

一旦有一个应用程序，您启动了它，它给出了2个数字：

主内存之间的mb/s传输速率和显存，从主图到图，纹理上传
mb/s 主存和显卡之间的传输速率内存，从图形到主，纹理下载

我只想再次把手放在上面。

另一个编辑（发现了一些东西）：

这里 http://www.benchmarkhq.ru/ english.html?/be_mm.html（搜索 TexBench）是一款以一种方式测量吞吐量的应用程序...

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

月野兔 2024-09-01 00:48:30

要测量主机到设备的内存带宽，您可以使用 CUDA SDK 中的 bandwidthTest 示例（从 CUDA 站点）。

回复收藏 0 原文

咽泪装欢 2024-09-01 00:48:30

第一：全局（GPU）内存和纹理之间的区别是由缓存定义的。纹理有它，全局内存则没有。

其次：从主机到（GPU）设备的纹理和全局内存的传输速率是相同的。

第三：从主机到 (GPU) 设备的传输速率随 GPU 代数的不同而变化，并由 PCI-express 总线和数据大小决定。

例如，请参阅： http://www.accelereyes.com/wiki/index .php?title=GPU_Memory_Transfer

回复收藏 0 原文

赢得她心 2024-09-01 00:48:30

您可以使用 cuda 配置文件来告诉您在 cuda 函数中花费的时间，包括内存传输时间。您可以编写非常简单的传输测试用例并对其进行测量。我认为，当您测量特定的测试用例时，这会更好。

查找 CUDA_PROFILE 以及如何使用它。 http://www.drdobbs.com/cpp/209601096?pgno=2

你的问题有点难以理解，你想测量主机和GPU之间的传输（纹理缓存并不真正相关）还是从内核内部读取纹理？

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

22 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

謌踐踏愛綪

文章 0 评论 0

开始看清了

文章 0 评论 0

高速公鹿

文章 0 评论 0

alipaysp_PLnULTzf66

文章 0 评论 0

热情消退

文章 0 评论 0

白色月光

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文