当前位置：文江博客话题详情

optimization branch opencl kernel

Opencl，使用指向不同本地内存的全局指针会创建分支吗？

发布于 2025-01-09 03:45:02 字数 362 浏览 5 评论 0原文

我有一个像这样的内核

kernel void k1(global int * a, global int * b, global int * c){
  int i = get_local_id(0);
  global int* ptr;
  if (i==0) ptr = &a[0];
  if (i==1) ptr = &b[0];
  if (i==2) ptr = &c[0];
  if (i>2) return;
  ptr[0]++;

}

我的问题是，ptr[0]++ 行会在访问内存时创建分支吗？或者与 a[0]++;b[0]++;c[0]++;在同一工作项内。

感谢您抽出时间。

I have a kernel like this

kernel void k1(global int * a, global int * b, global int * c){
  int i = get_local_id(0);
  global int* ptr;
  if (i==0) ptr = &a[0];
  if (i==1) ptr = &b[0];
  if (i==2) ptr = &c[0];
  if (i>2) return;
  ptr[0]++;

}

My question is, will the line ptr[0]++ create branching in accessing memory? or will this save time compared to
a[0]++;b[0]++;c[0]++; within same workitem.

Thanks for your time.

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

陌伤ぢ 2025-01-16 03:45:02

不，这不会创建分支，但至少在某些工作组中会破坏合并的内存访问。

您还可以通过三元运算符 (condition ? true_action : false_action) 或通过位掩码。这种简单的 if 语句和三元运算符最有可能转换为无分支汇编。如果没有保护子句 (if(i>2) return;)，则整个代码是无分支的。

尽管没有分支，但更重要的是，尤其是使用比您拥有的更复杂的指针算术（例如，当查找表确定指针值时），告诉应该访问哪个内存位置的算术将破坏某些工作组中的合并内存访问，这与简单的分支本身相比，可能会导致更慢的速度（尽管分支也不能解决未对齐的内存访问问题）。

在某些应用程序中，甚至可能以合并方式加载更多全局内存比减少全局内存访问但在进程中破坏合并更快。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

29 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

櫻之舞

文章 0 评论 0

弥枳

文章 0 评论 0

m2429

文章 0 评论 0

寻找一个思念的角度

文章 0 评论 0

野却迷人

文章 0 评论 0

我怀念的。

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文