为什么关于并发编程的书籍总是忽略数据并行?
Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…
生成 CUDA __device__ 内核内的 char 数组的所有组合
我需要帮助。我开始使用 CUDA (2.3 / 3.0beta) 编写一个常见的暴力破解器/密码猜测器。 我尝试了不同的方法来生成定义的 ASCII 字符集的所有可能的纯…
CUDA - 更好的占用 vs 更少的全局内存访问?
我的 CUDA 代码必须使用(减少到平均值/标准差,计算直方图)4 个数组,每个数组 2048 个浮点数,并且已经存储在以前内核的设备内存中。 通常建议启动…
C 中带括号和不带括号的循环处理方式不同吗?
我在调试器中单步执行一些 C/CUDA 代码,类似于: for(uint i = threadIdx.x i < 8379 i+=256) sum += d_PartialHistograms[blockIdx.x + i * HISTO…
如何使用软件实现在没有 GPU 的情况下运行 CUDA?
我的笔记本电脑没有 nVidia 显卡,我想在 CUDA 上工作。该网站称 CUDA 也可以在非 cuda 硬件上以仿真模式使用。但是,当我尝试安装从其网站下载的 CUD…
CUDA 主机到设备(或设备到主机)memcpy 操作以及在同一显卡上使用 OpenGL 渲染图形的应用程序
我已在 CUDA 论坛中发布了我的问题,但不确定在此处发布链接以获取更多想法是否合适,以防两个论坛之间存在大量不同的受众。链接位于此处。对于给您带…
CUDA:内核 CRT 的文档?
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
CUDA 与 CuBlas 内存管理
我注意到我可以使用使用 cudamalloc() 或 cublasalloc() 函数分配的矩阵内存块来调用 cublas 函数。尽管使用 cudamalloc() 分配的数组还有其他优点,…
CUBLAS内存分配错误
我尝试分配 17338896 个浮点数元素,如下所示(大约 70 mb): state = cublasAlloc(theSim->Ndim*theSim->Ndim, sizeof(*(theSim->K0)), (void…
通过 JNI 在 C 和 Java 之间传递指针
目前,我正在尝试创建一个使用 CUDA 功能的 Java 应用程序。 CUDA和Java之间的连接工作正常,但我有另一个问题,想问我的想法是否正确。 当我从 Java …
一个非常简单的Makefile应该是什么样子的,以便在linux下编译Cuda
我想在Linux下编译一个非常基本的hello world级别的Cuda程序。我有三个文件: 内核:helloWorld.cu 主要方法:helloWorld.cpp 公共头文件:helloWorld…