DirectX/Cuda/OpenGL 可访问的总内存/纹理内存
有人可以解释一下 Cuda 上下文中使用的纹理内存与 DirectX 上下文中使用的纹理内存的区别吗?假设一个显卡有512MB的标称内存,它是如何划分为常量内存…
我可以调用“类似函数的宏”吗?在 CUDA __global__ 函数的头文件中?
这是我的头文件 aes_locl.h 的一部分: . . # define SWAP(x) (_lrotl(x, 8) & 0x00ff00ff | _lrotr(x, 8) & 0xff00ff00) # define GETU32(p) S…
CUDA - 维护指向全局内存的指针
我有一个使用 CUDA 的 .NET 程序。 CUDA 通过 C DLL 访问。 我正在做的是通过在程序启动时在设备上分配缓冲区(cudaMalloc)来初始化我的 CUDA 应用程…
CUDA 基本矩阵加法 - 大矩阵
我正在尝试添加两个 4800x9600 矩阵,但遇到了困难... 这是一个简单的 C=A+B 操作... 这是内核: __global__ void matAdd_kernel(float* result,float…
我可以在主机进程之间共享 cuda GPU 设备内存吗?
是否可以有两个或多个 Linux 主机进程可以访问相同的设备内存? 我有两个进程在它们之间传输高数据速率,我不想将数据从 GPU 传回进程 A 中的主机,只…
多次调用 get_global_id() 与将结果保存在局部变量中?
这可能是一个愚蠢的问题,但是: 在 OpenCL 内核中调用某些 get_* 函数的成本有多高?是将结果保存在某些局部变量中以供将来使用更好,还是在需要时调…
CUDA超时? / 费米 / gtx465
我在 MS VS2005 上使用 CUDA SDK 3.1,GPU GTX465 1 GB。我有这样一个内核函数: __global__ void CRT_GPU_2(float *A, float *X, float *Y, float *Z…
使用 OpenMP 支持编译和链接 CUDA 源文件
是否可以在 CUDA 源文件(而不是内核代码)中使用 OpenMP 编译指示? 我将结合 GPU 和 CPU 计算。但是,当我使用 openmp 选项(在 Linux 下)链接程序…