OpenCL 存储体冲突 - 丢失内存/损坏数据？

发布于 2024-10-17 13:23:47 字数 473 浏览 5 评论 0原文

对于这个问题的含糊之处，我提前表示歉意。

背景：

我正在尝试用 OpenCL 编写形态学图像处理函数。我有一个 __local 缓冲区，用于存储每个像素的数据（每个像素由一个工作项表示，尚未展开循环）。另外，由于我处于早期测试阶段，因此我仅使用单个工作组（8x8 像素图像，以便我可以手动验证结果）。

问题：

有时必须将来自一个、两个、三个甚至四个像素的数据添加到另一个像素缓冲区中。由于这些是同一工作组中的相邻像素，因此我确信我导致了本地内存库冲突。没关系，速度还不是我的首要任务（目前为止！）。然而，这些银行冲突似乎正在丢失数据，甚至损坏数据。我一直非常小心，不要溢出或过度运行缓冲区。

所以，我的第一个问题是：银行冲突实际上是否有可能导致数据损坏和丢失？ Opencl 规范似乎表明操作应该串行化，从而降低带宽 - 但没有提到数据丢失。

我的第二个问题是：救命！ - 我能做什么呢？

任何指导将不胜感激 - 谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

终难愈 2024-10-24 13:23:47

可能是nvidia白皮书前缀总和（扫描）使用 CUDA 可以带您走上正轨。它与all-prefix-sums 算法有关，该是一个很好的计算示例，该计算看似本质上是顺序的，但有一个高效的并行算法。

code>all-prefix-sums 操作将数字列表 [3,4,1,2] 转换为它们的和：[0,3,7,8]代码>.

我知道这篇论文是关于 CUDA 的，但我发现生成的内核非常相似
两种技术都使用相似的概念。

我希望本文能对您有所帮助。

干杯

回复收藏 0 原文

~没有更多了~

关于作者

世界等同你

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

OpenCL 存储体冲突 - 丢失内存/损坏数据？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

浪漫人生路

620vip

羞稚

走过海棠暮

你好刘可爱

陌若浮生

友情链接

OpenCL 存储体冲突 - 丢失内存/损坏数据？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

浪漫人生路

620vip

羞稚

走过海棠暮

你好刘可爱

陌若浮生

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。