OpenCL FPGA:内核 未并行执行同一内核的 2 个副本。除此之外,他们之间还有空闲时间

发布于 2025-01-18 03:30:33 字数 235 浏览 3 评论 0原文

我的目标是将2-4K数据点的FFT一起完成。因此,我从相同的内核制作了2个内核对象,并立即重现任务,即没有任何缓冲区读写或之间的任何回调。我发现那不会那样发生。除此之外,执行之间还有一些空闲时间。有人可以解释吗? “程序的aocl报告”

我希望他们两个都在并行运行,因为我的FPGA似乎有更多的区域。使用了其中约38%。

My goal is to complete FFTs of 2 - 4K Data points together. Hence, I made 2 kernel objects from the same kernel and Enqueued the tasks at once, i.e. without any Buffer Read-Write or any callbacks in between. I find out that it doesn't happen that way. In addition to that, there is also some idle time between the executions. Can someone please explain?
AOCL Report of the Program

I was expecting both of them to run in parallel because my FPGA seems to have more area. About 38 percent of it is used.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

以酷 2025-01-25 03:30:33

OpenCL 队列按顺序工作,因此一个内核会在另一个内核之后执行。这可以确保 - 如果内核 2 读取内核 1 已更新的内存,则不会出现竞争条件,就像它们同时运行一样。开始执行内核也可能存在一些延迟。

要并行运行多个内核,可以尝试多个队列。

The OpenCL queue works sequentially, so one kernel is executed after the other. This makes sure that - if kernel 2 reads memory that kernel 1 has updated, there is no race condition like if they would run concurrently. There may also be some latency to start execution of a kernel.

To run multiple kernels in parallel, you can try multiple queues.

秋叶绚丽 2025-01-25 03:30:33

我发现这个问题解决了我的疑问。它可以找到在这里

I found this question that kind off answers my doubts. It can be foundhere

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文