CUDA:跨不同内核使用共享内存
这可能吗? 我试图在一个内核中定义一个共享内存数组,然后我需要在不同的内核中使用这些值。 我尝试声明 extern __shared__ float sharedMem[]; 外部…
创建具有块大小的共享向量?
我需要创建一个共享向量,其大小与块相同。 __global__ func() { const int size = blockDim.x; __shared__ float* Vec[size]; .. } 我收到此错误, e…
GPU 共享内存大小非常小 - 我该怎么办?
目前大多数 nVIDIA GPU 上的共享内存(OpenCL 术语中的“本地内存”)大小仅为 16 KiB。 我有一个应用程序,需要在其中创建一个包含 10,000 个整数的…
CUDA 共享内存阵列 - 奇怪的行为
在 CUDA 内核中,我有类似于以下的代码。 我试图为每个线程计算一个分子,并将分子累加到块上以计算分母,然后返回比率。 但是,CUDA 将 denom 的值设…