使用并行扫描构建堆

发布于 2024-12-21 06:44:26 字数 199 浏览 1 评论 0原文

我在 NVIDIA 的网站上读到,可以使用 CUDA 和扫描操作并行构建一棵树。我想知道是否有任何文档解释如何使用扫描操作并行构建堆。任何包含此代码的文档也都很棒。我的 GPU 内存中有一些值,我需要从中返回前 k 个值。我在想并行构建一个堆并返回前 k 个结果将是一个好主意。

或者,如果没有这样的文档,我想知道是否有任何文档解释如何使用 scan 并行构建一棵树。

I read on NVIDIA's website that one can build a tree in parallel using CUDA and scan operation. I was wondering if there are any documents that explain how one can build a heap in parallel using the scan operation. Any documents that contain the code for this will also be great. I have some values on the GPU memory out of which I need to return the top k values. I was thinking building a heap in Parallel and returning top k results would be a good idea.

Alternatively, if there are no such documents, I was wondering if there are any documents that explain how one can build a tree in parallel using scan.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

他是夢罘是命 2024-12-28 06:44:26

Sean Baxter 在此处讨论订单统计:

http://www.moderngpu.com/select/mgpuselect.html< /a>

虽然他的函数实现了第 k 个元素的选择,而不是前 k 个元素的计算。

他的网站还广泛报道了 Scan。

Sean Baxter discusses order statistics here:

http://www.moderngpu.com/select/mgpuselect.html

although his function implements selection of the k'th element, not computation of the top k elements.

His Web site also features extensive coverage of Scan.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文