如何验证双打是否已启用并在 cuda 内工作?
我想知道我的 CUDA 设备是否启用了双精度,因为它是具有 CUDA 运行时 4.0(SDK 和工具包、最新驱动程序)的计算能力 2.0 设备。 如何验证双精度是否已…
在 __device/global__ CUDA 内核中动态分配内存
根据 CUDA 编程指南,第 122 页,只要我们使用计算架构 2.x,就可以在 device/global 函数内动态分配内存。 我的问题是,当我尝试执行此操作时,我收…
缺少 cutil 调试库:无法打开文件 cutil32D.lib
当我尝试运行任何示例代码时:它给出了以下错误。 错误 1 错误 LNK1104:无法打开文件“cutil32D.lib”C:\Documents 和设置\所有用户\应用程序数…
使用事件对 CUDA 应用程序进行计时
我使用以下两个函数对代码的不同部分(cudaMemcpyHtoD、内核执行、cudaMemcpyDtoH)进行计时(包括多 GPU、同一 GPU 上的并发内核、内核的顺序执行等…
CUDA 视觉分析器“交互式” X 配置选项?
在 Ubuntu 11.04 上的computeprof 中启动应用程序时,我收到以下警告: 所选计数器“gld 指令 8 位”、“gld 指令 16 位”、“gld 指令 32 位”、“gl…
如何诊断由于资源不足而导致 CUDA 启动失败?
我在尝试启动 CUDA 内核(通过 PyCUDA)时遇到资源不足错误,我想知道是否可以让系统告诉我缺少哪个资源。显然系统知道什么资源已经耗尽,我也只想查…
“车道用户堆栈溢出”调试CUDA程序
我正在使用 Totalview 尝试调试 CUDA 内核。我选择了调试 CUDA 中的内存错误并在主机上出现内存错误时停止的选项。 我在这一行的其中一个内核中停止了…
CUDA - 复制到对象数组中的数组
我有一个 CUDA 应用程序,正在处理一组对象;每个对象都有一个指向 std::pair 数组的指针。我正在尝试 cudaMemcpy 对象数组,然后 cudaMemcpy 对每个…
CUDA似乎达到了极限,但那是什么极限呢?
我有一个 CUDA 程序,似乎达到了某些资源的某种限制,但我无法弄清楚该资源是什么。这是内核函数: __global__ void DoCheck(float2* points, int* se…
稀疏几何的 3d 希尔伯特曲线
我有一个 3d 数组,其中包含稀疏几何图形的非立方边界框。 如果 (x,y,z) 是计算域的一部分,则数组 Geometry[x][y][z] 包含值 0,否则为 1。 为了重新…
CUDA 运行时错误 4 - 从 CUDA 3.2 更新到 CUDA4 后显示
我最近尝试将我的系统从 CUDA 3.2 更新到 CUDA 4.0 这似乎不是一个非常顺利的更新。首先,现在很多 SDK 示例都失败了。 MatrixMul 和 FFT 问题等等都…
在 CUDA 中分配设备变量时遇到问题
我在尝试为设备变量分配值然后将其复制到主机变量时遇到问题。 我从 d_test 和 h_test = 0.0 开始。我有一个简单的内核来将设备变量 d_test 设置为 1.…