当前位置：文江博客话题详情

直接在主机上访问设备向量元素的最快方法

发布于 2024-12-23 03:39:18 字数 384 浏览 1 评论 0原文

我建议您参阅以下页面 http://code.google.com/p/thrust /wiki/QuickStartGuide#Vectors。请参阅第二段，它说

另请注意，可以访问 device_vector 的各个元素使用标准括号表示法。然而，因为这些中的每一个访问需要调用 cudaMemcpy，应谨慎使用。稍后我们将讨论一些更有效的技术。

我搜索了整个文档，但找不到更有效的技术。有谁知道最快的方法来做到这一点？即如何最快地访问主机上的设备向量/设备指针？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

半衬遮猫 2024-12-30 03:39:18

该指南提到的“更有效的技术”是 Thrust 算法。一次访问（或通过 PCI-E 总线复制）数百万个元素比访问单个元素更有效，因为 CPU/GPU 通信的固定成本已摊销。

将数据从 GPU 复制到 CPU 没有比调用 cudaMemcpy 更快的方法了，因为这是 CUDA 程序员实现任务的最原始方法。

回复收藏 0 原文

人间☆小暴躁 2024-12-30 03:39:18

如果您有需要进行更多处理的 device_vector，请尝试将数据保留在设备上并使用 Thrust 算法或您自己的内核对其进行处理。如果您只需要从 device_vector 中读取几个值，只需使用括号表示法直接访问这些值即可。如果您需要访问多个值，请将 device_vector 复制到 host_vector 并从那里读取值。

thrust::device_vector<int> D;
...
thrust::host_vector<int> H = D;

If you have a device_vector which you need to do more processing on, try to keep the data on the device and process it with Thrust algorithms or your own kernels. If you need to read only a few values from the device_vector, just access the values directly with bracket notation. If you need to access more than a few values, copy the device_vector over to a host_vector and read the the values from there.

thrust::device_vector<int> D;
...
thrust::host_vector<int> H = D;

回复收藏 0 原文

~没有更多了~

关于作者

世界和平

暂无简介

文章

25 人气

关注发私信

友情链接

文江博客

直接在主机上访问设备向量元素的最快方法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

直接在主机上访问设备向量元素的最快方法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。