CUDA 和 HPC 中的一维问题
我正在寻找 CUDA 和 HPC 中的一些一维问题,例如 Black Scholes。 我所说的一维问题是指所有工作都在一维数组上完成的问题。虽然矩阵乘法可以用这种方…
在 xp 中使用 Cuda 和基于 Forms 的 GUI
CUDA 编程是全新的,请耐心等待。我终于让cuda在win xp(32位)上使用Visual studio 2008在控制台应用程序中工作。但我的主要目标是将现有程序移植到c…
使用 CUDA 构建 OpenCV
我正在尝试使用 Visual C++ 2008 Express 版本构建 openCV 库。我从 opencv svn 服务器下载了最新的代码并使用 CMake 2.8 创建项目。我在默认目录中安…
使用 Thrust CUDA 对对象进行排序
是否可以使用 Thrust 库对对象进行排序? 我有以下结构: struct OB{ int N Cls *C //CLS is another struct. } 是否可以使用推力根据 N 对 OB 数组进…
CUDA 查找给定数组中的最大值
我尝试开发一个小型 CUDA 程序来查找给定数组中的最大值, int input_data[0...50] = 1,2,3,4,5....,50 max_value 由 input_data[0] 的第一个值初始化…
CUDA warp 中的线程是否在多处理器上并行执行?
一个经纱是 32 个线程。 32 个线程在多处理器中并行执行吗? 如果 32 个线程没有并行执行,则 warp 中不存在竞争条件。 在看了一些例子后我产生了这个…
在哪里可以找到有关 CUDA 4.0 中统一虚拟寻址的信息?
在哪里可以找到有关使用 CUDA 4.0 中新增强功能的信息/变更集/建议?我对了解统一虚拟寻址特别感兴趣? 注意:我真的很想看一个例子,我们可以直接从 …
FFTW 和 CUFFT 输出之间的差异
在我在下面发布的字符中,我比较了 FFTW 和 CUFFT 中运行的 IFFT 的结果。 造成这种结果不同的可能原因是什么?舍入误差真的有那么大吗? 这是相关的…
如何使用CUFFT的批处理模式?
我试图弄清楚如何使用 CUFFT 库中提供的批处理模式。 我基本上有一个宽 5300 像素、高 3500 像素的图像。目前,这意味着我正在使用 FFTW 对这 5300 个…
CUDA 是什么样的?它是做什么用的?有什么好处?以及如何开始?
我对在一些新技术下进行开发很感兴趣,并且我正在考虑尝试 CUDA。现在...他们的文档技术性太强,没有提供我正在寻找的答案。另外,我想听听那些已经有…
#define 和 CUDA
为什么以下代码片段不适用于 CUDA(3.2 和 4.0)? #define NUM_BLOCKS 16 // lots of code. dim3 dimBlock(NUM_BLOCKS, NUM_BLOCKS) 但这, dim3 dim…
CUDA 中的 threadfence 内在函数的用途是什么?
我浏览了许多论坛帖子和 NVIDIA 文档,但我无法理解 __threadfence() 的作用以及如何使用它。有人可以解释一下该内在函数的目的是什么吗?…