为什么 Cuda/OpenCL 的全局内存中不存在库冲突?
我还没有弄清楚并且谷歌没有帮助我的一件事是,为什么有可能与共享内存发生银行冲突,但在全局内存中却没有?银行与寄存器会存在冲突吗? 更新 哇,我…
什么是银行冲突? (进行Cuda/OpenCL编程)
我一直在阅读 CUDA 和 OpenCL 的编程指南,但我无法弄清楚银行冲突是什么。他们只是深入研究如何解决问题,而不详细说明主题本身。有人能帮我理解吗?…
部分卡上的 cuda 应用程序
我有一台 Nvidia Tesla s2050;带有 nvidia Quadro 卡的主机。带有 CUDA 3.1 的 CentOS 5.5 当我运行 cuda 应用程序时,我想使用 4 Tesla c-2050,但…
如何调查仅在配备 NVIDIA Quadro 的计算机上经常发生的客户端 WSAECONNABORTED?
我们有一个 C++ 客户端/服务器应用程序,其中客户端从服务器检索并呈现 3D 内容。 我们的客户端经常与服务器断开连接(超过 50% 的运行时间不到 1 分…
Linux 中没有 X.org 的 OpenGL
我想在 Linux 中打开一个没有 X 的 OpenGL 上下文。有什么办法可以做到吗? 我知道集成英特尔显卡硬件是可能的,尽管大多数人的系统中都有 Nvidia 卡…
CUDA 基本矩阵加法 - 大矩阵
我正在尝试添加两个 4800x9600 矩阵,但遇到了困难... 这是一个简单的 C=A+B 操作... 这是内核: __global__ void matAdd_kernel(float* result,float…
glBufferData 由于尺寸过大而默默失败
我刚刚注意到,当我尝试使用 size: 1085859108 和 data: NULL 调用 glBufferData 时,它会默默地失败。 以下对 glBufferSubData 的调用失败并出现 OUT…
CUDA超时? / 费米 / gtx465
我在 MS VS2005 上使用 CUDA SDK 3.1,GPU GTX465 1 GB。我有这样一个内核函数: __global__ void CRT_GPU_2(float *A, float *X, float *Y, float *Z…
CUDA 中全局内存的原子操作是否跨扭曲并行执行?
我需要在 CC 2.0 设备上的全局内存上执行原子 FP 添加操作。如果 warp 中引用的全局数据适合对齐的 128 字节扇区,这些操作是并行完成还是一次执行一…
NVIDIA CUDA SDK 示例编译不支持的架构“compute_20”
在编译 CUDA SDK 时,我收到 nvcc fatal : Unsupported gpu Architecture 'compute_20' 我的工具包是 2.3,位于共享系统上(即无法真正升级),驱动程…
如何在未安装 VS2008 的情况下为 VS2010 安装 Nvidia Parallel NSight (Nexus)?
有没有办法在不安装 VS2008 SP1 的情况下安装 Parallel NSight 并将其与 Visual Studio 2010 一起使用? 安装程序会检查 VS2008 是否已安装,如果没有…
不同 CUDA SDK 之间的性能差异?
如果我想重新编写我的应用程序,以便利用 nVidia 的 CUDA SDK 的强大功能,不同 SDK 产品(C++、Java、Python)之间的运行时性能是否有任何差异? 除…
在 Windows XP 上编译 NVIDIA Quadro FX SDK (NVGVOSDK)
我在 Windows XP 盒子中连接了 NVIDIA Quadro FX 4800 卡,我尝试使用 NVGVOSDK。这个 SDK 没有很好的文档记录并且相当旧。我从 NVIDIA 合作伙伴网站…