当前位置：文江博客话题详情

使用 CUDA 创建链表

发布于 2024-09-28 09:43:30 字数 100 浏览 5 评论 0原文

是否可以使用 CUDA 在 GPU 上创建链表？
我正在尝试这样做，但遇到了一些困难。
如果我无法在 CUDA 内核中分配动态内存，那么如何创建新节点并将其添加到链表中？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

陌若浮生 2024-10-05 09:43:30

如果可以的话，你真的不想这样做 - 如果你无法摆脱链接列表，你能做的最好的事情就是通过数组模拟它们并使用数组索引而不是链接指针。

回复收藏 0 原文

狼亦尘 2024-10-05 09:43:30

GPU 上的链表有一些有效的用例。考虑使用跳过列表作为替代方案，因为它们提供更快的操作。通过 Google 搜索可以找到高度并发的跳过列表算法的示例。

查看此链接 http://www.cse.iitk.ac。在/users/mainakc/lockfree.html/
对于 CUDA 代码，有关许多无锁 CUDA 数据结构的 PDF 和 PPT 演示。

可以使用缩减算法方法并行构建链接列表。这假设所有成员在构建时都是已知的。每个线程首先连接 2 个节点。然后一半线程将 2 个节点段连接在一起，依此类推，每次迭代将线程数减少 2 个。这将在 log2 N 时间内构建一个列表。

内存分配是一个限制。预先分配主机上阵列中的所有节点。然后你可以使用数组下标来代替指针。这样做的优点是列表遍历在 GPU 和主机上都有效。

对于并发性，您需要使用 CUDA 原子操作。原子添加/递增用于对节点数组中使用的节点进行计数，并进行比较和交换以设置节点之间的链接。

再次仔细考虑用例和访问模式。使用一个大的链表是非常串行的。使用 100 - 100 个小链表更加并行。我希望内存访问不会合并，除非注意在相邻内存位置分配连接的节点。

回复收藏 0 原文

找回味觉 2024-10-05 09:43:30

我同意保罗的观点，链表是一种非常“串行”的思维方式。忘记您所学到的有关串行操作的知识，立即完成所有操作:)

回复收藏 0 原文

独守阴晴ぅ圆缺 2024-10-05 09:43:30

查看 Thrust 了解常见操作的方式

回复收藏 0 原文

~没有更多了~

关于作者

无法回应

暂无简介

0 文章

0 评论

22 人气

关注发私信

留蓝

文章 0 评论 0

关注

18790681156

文章 0 评论 0

关注

zach7772

文章 0 评论 0

关注

Wini

文章 0 评论 0

关注

ayeshaaroy

文章 0 评论 0

关注

初雪

文章 0 评论 0

友情链接

文江博客

使用 CUDA 创建链表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

使用 CUDA 创建链表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。