gpu-shared-memory

gpu-shared-memory

文章 0 浏览 4

CUDA:跨不同内核使用共享内存

这可能吗? 我试图在一个内核中定义一个共享内存数组,然后我需要在不同的内核中使用这些值。 我尝试声明 extern __shared__ float sharedMem[]; 外部…

神魇的王 2024-11-01 06:14:09 6 0

共享内存优化混乱

我在 CUDA 中编写了一个应用程序,它在每个块中使用 1kb 共享内存。 由于每个SM中只有16kb的共享内存,所以总共只能容纳16个块,对吗?虽然一次只能调…

下壹個目標 2024-10-31 04:03:36 8 0

CUDA:具有重叠边界的共享内存分配

有没有一种简单的方法(谷歌尚未提供...)从单个输入数组中分配每块共享内存区域,以便可以存在重叠? 简单的例子就是字符串搜索;看到我想将输入文本…

七禾 2024-10-30 18:32:31 5 0

分配共享内存

我试图通过使用常量参数来分配共享内存,但出现错误。我的内核看起来像这样: __global__ void Kernel(const int count) { __shared__ int a[count]; …

瑾夏年华 2024-10-28 21:45:23 9 0

OpenCL 本地内存有限制吗?

今天,我向内核添加了四个 __local 变量以转储中间结果。但是,只需将这四个变量添加到内核签名并添加相应的内核参数,就会将内核的所有输出呈现为“0…

似梦非梦 2024-10-21 01:36:12 12 0

创建具有块大小的共享向量?

我需要创建一个共享向量,其大小与块相同。 __global__ func() { const int size = blockDim.x; __shared__ float* Vec[size]; .. } 我收到此错误, e…

相权↑美人 2024-10-18 21:50:10 5 0

GPU 共享内存大小非常小 - 我该怎么办?

目前大多数 nVIDIA GPU 上的共享内存(OpenCL 术语中的“本地内存”)大小仅为 16 KiB。 我有一个应用程序,需要在其中创建一个包含 10,000 个整数的…

万水千山粽是情ミ 2024-10-17 07:41:58 10 0

GPU 共享内存库冲突

我试图了解银行冲突是如何发生的。 我在全局内存中有一个大小为 256 的数组,并且在单个块中有 256 个线程,我想将该数组复制到共享内存。因此每个线…

撧情箌佬 2024-10-07 06:01:28 13 0

CUDA 共享内存阵列 - 奇怪的行为

在 CUDA 内核中,我有类似于以下的代码。 我试图为每个线程计算一个分子,并将分子累加到块上以计算分母,然后返回比率。 但是,CUDA 将 denom 的值设…

琉璃繁缕 2024-07-26 03:02:58 12 0
更多

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待"谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文