CUDA 和 OpenCL 之前的 GPGPU
我一直在阅读有关 CUDA 和 OpenCL 的内容,并了解到在这些框架之前,开发人员只能使用 OPENGL 和 D3D 等低级 API。不幸的是我没能找到很多关于它的信…
在VS2008中构建CUDA程序时出现问题:LNK2019
我在构建程序时遇到了一些麻烦。我正在使用 Visual Studio 2008 处理 Windows 7 professional 32 位。我有 Cuda SDK,并且我的项目设置了 cudart.lib …
CUDA 中全局内存的原子操作是否跨扭曲并行执行?
我需要在 CC 2.0 设备上的全局内存上执行原子 FP 添加操作。如果 warp 中引用的全局数据适合对齐的 128 字节扇区,这些操作是并行完成还是一次执行一…
cudaMemcpy - 检查
有人可以给我以下建议吗? 我正在将一些数据从 CPU 复制到 GPU,我需要知道它是否复制正确。 我可以检查 cudeMemcpy 的返回码,但如果我可以在 GPU 上…
向设备发送 char ** 数据类型
我有一个字符指针数组,我想将其发送到设备。有人可以告诉我怎么做吗? 这是我到目前为止所尝试过的: char **a char **b *a[0]="Foo1" *a[1]=="Foo2"…
CUDA:VFW - 编解码器 DLL
我的英语不是很好,对此我感到很抱歉。 我有一个基于 VFW 接口的 Windows(C++)视频编解码器项目。它编译成dll,设置并成功运行。 我想要的是添加 CU…
CUDA:cudaMemcpy 返回 __device__ 数组的 cudaErrorInvalidValue
当我在设备上定义一个数组(在本例中使用“Hello”字符串初始化)并尝试将其复制到主机时,我收到错误代码 cudaErrorInvalidValue。然而,从内核内部…
NVIDIA CUDA SDK 示例编译不支持的架构“compute_20”
在编译 CUDA SDK 时,我收到 nvcc fatal : Unsupported gpu Architecture 'compute_20' 我的工具包是 2.3,位于共享系统上(即无法真正升级),驱动程…
如何在 CUDA 设备上处理 64 位字?
我想在 CUDA 平台上直接处理 64 位字(例如 uint64_t vars)。 不过,据我所知,寻址空间、寄存器和 SP 架构都是基于 32 位的。 我实际上发现它可以正…
如何转换 C++使用 CUDA 到 MEX 中的程序
为了工作,我将 CUDA SDK 附带的图像去噪程序转换为 MATLAB 程序。据我所知,我已经进行了 MATLAB 所需的所有必要更改,但是当我尝试对其调用 mex 时…
在CUDA下如何改进这个功能?
我可以在CUDA下改进以下功能吗? 该函数的作用是, 给定 min 和 max、ELM1 和 ELM,检查是否有任意三个数字数组 ans[6] 位于数组 D1 中从 min 到 max …
使用 GPU 的 CUDA 同时启动多个内核
是否可以同时启动两个执行独立任务的内核。例如,如果我有这个 Cuda 代码, // host and device initialization ....... ....... // launch kernel1 m…