有没有办法记录 cuda 的“.cu”文件使用 doxygen
由于cuda的“.cu”文件基本上是c,有没有办法我们可以使用doxygen为“.cu”文件生成文档?我注意到 NVIDIA 使用 doxygen 来生成 cuda 的文档。但是,…
如何以程序员愉快的方式使用 CUDA 常量内存?
我正在使用 CUDA 框架开发一个数字处理应用程序。我有一些应该可供所有线程访问的静态数据,因此我将其放入常量内存中,如下所示: __device__ __cons…
如何使用 CUDA 在一个 GPU 上运行 1 个以上内核?
kernel1 <<< blocks1, threads1, 0, stream1 >>> ( args ... ) ... kernel2 <<< blocks2, threads2, 0, stream2 >>> ( args …
CUDA 3.2 中的仿真模式与 VS2008
我正在尝试使用设备模拟模式调试内核代码。 但是,我在内核中设置了断点,但它没有中断。 MatrixMultiplication_Kernel<<<dimGrid, dimBlock>…
两个几乎相同的调用,一个有效,一个失败
我有这些模板函数,可以在带有 cuda 的设备上内联使用, template <class T> __device__ inline T& cmin(T&a,T&b){return (a<b)?(a):(…
如何动态创建方法来操作在运行时初始化的类对象
我有一个类,比如说 class AddElement{ int a,b,c } 用方法来设置/获取 a,b,c... 我的问题绝对是一个逻辑问题 - 假设我实现 AddElement 如下: int Va…
如何使用 Visual Studio 2008 调试 CUDA 内核代码?
嘿, 我正在使用带有 CUDA 3.2 的 Visual Studio 2008。我正在尝试调试具有此签名的函数: MatrixMultiplication_Kernel<<<dimGrid, dimBlock&g…
CUDA:使用 -deviceemu 和 gdb 进行调试
我编写了一个 CUDA 应用程序,其中包含一些硬编码参数(通过#define)。一切似乎都正常,所以我尝试了一些其他参数。现在,该程序不再正常工作。 所以…
如何创建 CUDA makefile 以便在 CPU 中执行以测试 CPU FLOP?
我正在尝试计算 GPU 和 CPU FLOPs,并且我从 此处 我将其重命名为 cudaflops.cu 并使用此 makefile 对其进行编译 ##################################…
固定内存OpenCL,有人成功使用过吗?
我在 clCreateBuffer 调用中使用了 CL_MEM_ALLOC_HOST_PTR 标志,但计算探查器将我的所有“主机内存传输类型”显示为可分页。我在两种不同的内核设置…
CUDA 内核在 2 个不同的 GPU 上抛出不同的结果(GeForce 8600M GT 与 Quadro FX 770M)
我一直在开发 AES CUDA 应用程序,并且有一个在 GPU 上执行 ECB 加密的内核。为了确保并行运行时算法的逻辑不会被修改,我发送 NIST 提供的已知输入测…
使用 Visual Studio 2010 编译 CUDA
我之前曾使用 Visual Studio 2008 来编译和运行 CUDA 应用程序。我已切换到 Visual Studio 2010 和 Windows 7。我整个上午都在尝试设置集成,但尚未完…