共享内存上的原子操作
如何在共享内存上执行原子操作? 我有类似的东西: __shared__ int a[10] //set a if(tid<5) a[2]++ 因此 5 个线程正在递增 a。我该怎么做? 我知道…
如何在 Fortran 中创建自定义数组?
我一直在考虑将 cuda 库移植到 Fortran。 PGI 和 EM Photonics 似乎是目前存在的两个库。但是我只在这里找到了我正在寻找的东西 real, device, alloca…
推力:sort_by_key 和 zip_iterator 性能
问题 我正在使用 sort_by_key 并使用 zip_iterator 传递值。这个 sort_by_key 被调用了很多次,并且在一定的迭代之后,它变得慢十倍!造成性能下降的…
学习共享内存、分布式内存和/或 GPU 编程的示例问题和解决方案是什么?
我们正在寻找将在任何或所有共享内存、分布式内存和 GPGPU 架构上运行的示例问题和代码。我们使用的参考平台是LittleFe (littlefe.net),这是一个开放…
使用 Optimus 的笔记本电脑上的 CUDA 出现问题
我已在配备 GeForce GT 325M (Win7 x64) 的 ASUS N61J 上安装了 CUDA 工具包 v4.0 RC2。 设法将 Cuda 与 Visual Studio 2010 集成。 我尝试运行从这里…
PyCUDA:查询设备状态(特别是内存)
PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…
CUDA:不支持未对齐的内存访问:我错过了什么?
有一些问题类似对此,但在这种情况下,它有点奇怪; NVCC 3.1 不喜欢这样,但 3.2 和 4.0RC 喜欢; float xtmp[MAT1] for (i=0 i<MAT1 i++){ xtmp[i…
将 matlab FFT 转换为 CUDA FFT
我目前正在使用以下 matlab 函数: function out = fft_2d(in) out = fftshift(fft2(ifftshift(in))) 据我了解,这需要一个“自然顺序”输入,并将其…