当前位置：文江博客话题详情

CUDA中二维数组的有效缩减？

发布于 2024-09-12 13:27:10 字数 143 浏览 15 评论 0原文

CUDA SDK 中提供了示例代码和演示幻灯片，可实现高效的一维缩减。我还看过几篇关于 CUDA 中一维缩减和前缀扫描的论文和实现。

是否有高效的 CUDA 代码可用于减少密集二维数组？指向代码或相关论文的指针将不胜感激。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

很酷不放纵 2024-09-19 13:27:10

我不知道你到底想解决什么问题，但实际上你可以简单地将 2D 数组视为一个长的 1D 数组，并使用 SDK 代码来减少操作。 CUDA 中的简单数组只是具有特殊寻址规则的一维内存块 - 为什么不利用这个机会呢？

回复收藏 0 原文

记忆消瘦 2024-09-19 13:27:10

矩阵简化可能更容易实现，因为行/列简化为向量可以独立完成。您可以让每个线程处理列/行（取决于矩阵主要维度方向）并合并内存读取。我怀疑你可以在不使用纹理/常量缓存的情况下购买更多的性能，因为局部性可能变得很重要

回复收藏 0 原文

~没有更多了~

关于作者

╄→承喏

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

CUDA中二维数组的有效缩减？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

CUDA中二维数组的有效缩减？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。