当前位置：文江博客话题详情

loops cuda unroll

如果行程计数不恒定，为什么 #pragma-unrolled 循环的性能会下降？

发布于 2024-10-29 14:30:58 字数 202 浏览 2 评论 0原文

我有以下使用循环展开的代码：

#pragma unroll
for (int i=0;i<n;i++)
{
    ....
}

这里如果 n 是定义的常量，则一切正常。然而，如果 n 是一个变量，性能就会急剧下降。我注意到大约有 3 次指令被发出和执行。我想我正在寻找一种在运行时展开循环的方法，这可能是不可行的。

I have following code using loop unrolling:

#pragma unroll
for (int i=0;i<n;i++)
{
    ....
}

here if n is a defined constant, everything works fine. However, if n is a variable, performance dramatically reduced. I noticed roughly 3 times the instructions are issued and executed. I guess I am looking for a way to do loop unrolling at run time, may be that's just not feasible.

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

攀登最高峰 2024-11-05 14:30:58

CUDA 是一种编译语言。循环展开是一种编译器优化。运行时循环展开意味着某种运行时解释器或动态代码生成。这显然不可能发生。

展开的情况执行与朴素循环一样多或更多的指令是有意义的，因为编译器将用循环内容的重复来替换循环。如果展开的情况执行较少指令，则意味着编译器正在预先计算部分或全部循环内容并用常量结果替换代码。

这完全取决于循环中包含的内容。

回复收藏 0 原文

~没有更多了~

关于作者

尽揽少女心

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

我早已燃尽

文章 0 评论 0

就像说晚安

文章 0 评论 0

donghfcn

文章 0 评论 0

脱单之前绝不改名′

文章 0 评论 0

凡尘雨

文章 0 评论 0

鲜血染红嫁衣

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文