在 Windows 中设置 OpenGL/Cuda 互操作
我正在编写一个 DLL,需要在 Cuda 3.2 中完成一些工作,在 OpenGL 中完成一些工作。 OpenGL将渲染一些我的Cuda代码需要读入和修改的灰度图像,然后作…
编译调用 Surface 低级 CUDA API 的代码时出现奇怪的错误
这个最小的例子: int main() { struct surfaceReference* surfaceReferencePointer cudaGetSurfaceReference(&surfaceReferencePointer, "surface…
重写通过 cudaHostAlloc() 分配的内存
我有一个 100MB 的字符数组 (h_array),它是使用 cudaHostAlloc() 和标志 cudaHostAllocWriteCombined 进行分配的。 程序首先将数据复制到主机上的h_a…
CUDA - 简单的矩阵加法/求和运算
这应该非常简单,但我找不到详尽的答案: 我需要使用矩阵执行 A+B = C,其中 A 和 B 是两个未知大小的矩阵(它们的最大值可能是 2x2 或 20.000x20.000…
开源 CUDA IDE
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
CUDA:有关活动扭曲(活动块)以及如何选择块大小的问题
假设一个 CUDA GPU 在一个多处理器上可以有 48 个同时活动的 warp,即 48 个块的 1 个 warp,或 24 个块的 2 个 warp,...,因为来自多个块的所有活动…
CUDA Fortran:具有单独名称的多个共享数组?
是否确实可以在 CUDA Fortran 中分配多个共享数组,而不必只使用一个共享数组并使用索引偏移? 指针不起作用,“指针”和“目标”属性与“共享”属性…
如何将我现有的 .cpp 代码与 cuda 一起使用
我用 c++ 编写了代码,想将它与 cuda 一起使用。有人可以帮助我吗?我应该提供我的代码吗?实际上我尝试这样做,但我需要一些起始代码来继续我的代码…
cuda 和 c++问题
你好,我有一个运行成功的 cuda 程序 这是 cuda 程序的代码, #include <stdio.h> #include <cuda.h> __global__ void square_array(float *a…
使用纹理内存在 CUDA 中进行过滤
我在 CUDA 中使用纹理内存进行图像过滤: texture<unsigned char> texMem //deceleration cudaBindTexture( NULL, texMem,d_inputImage,imageSize…