CUDA FORTRAN:如果我传递变量而不是数字,函数会给出不同的答案
我正在尝试使用 ISHFT() 函数使用 CUDA FORTRAN 并行位移一些 32 位整数。 问题是,即使 var = -4 ,我对 ISHFT(-4,-1) 和 ISHFT(var,-1) 得到不同的…
Cuda 代码#define 错误,预期出现“)”
在下面的代码中,如果我将 #define N 65536 置于 #if FSIZE 之上,则会出现以下错误: #if FSIZE==1 __global__ void compute_sum1(float *a, float *…
使用 CUDA 实现、python (pycuda) 或 C++ 处理图像?
我正在做一个使用 CUDA 处理图像的项目。该项目只是图像的加法或减法。 请问您的专业意见,哪个最好,这两个有什么优缺点? 我感谢大家的意见和/或建…
在 cuda-cdb 中切换块焦点
很简单...我想改变 cuda-gdb 中的焦点。我可以更改为当前块(块 0)内的不同线程,但不能更改为不同的块。我使用的是cuda/cuda-gdb 3.0 3.0手册中的方…
CUDA int4 按位运算
我想知道 CUDA 的向量类型(如 int4/int2)是否有可用的按位运算?我在 cutil_math.h 中看到很多辅助函数,但没有任何位(左移/右移)操作,所以我可…
Ubuntu 10.04 上的 OpenCL 安装
我有一个问题,我想要一个快速的解决方案......任何帮助都会受到赞赏。 我有一台配备 ubuntu10.04 和 Nvidia 8400M GS 显卡的笔记本电脑。我最近开始…
如何在 CUDA FORTRAN 中生成随机数?
我正在寻找一种简单的方法来为并行的多个线程生成 0.0 和 1.0 之间的随机浮点数。到目前为止,这是我的内核.. attributes(global) subroutine rand_ke…
什么是真正的 C++ CUDA 设备代码支持的语言结构?
CUDA 文档 3.2 版本的附录 D 提到了 CUDA 设备代码中的 C++ 支持。 明确提到CUDA支持“计算能力2.x设备的类”。但是,我正在使用计算能力 1.1 和 1.3 …
对并发 CUDA 内核进行计时
不幸的是,基于 fermi 的 GPU 将跟踪在 Parallel Nsight 中序列化的任何内核时序,即使它们是不同流中的并发内核。 任何人都可以建议如何使用计时器手…
程序在有效缓冲区的删除[]上崩溃..我认为
我有一个文件,我试图在某些函数中使用 cuComplex 和 std::complex 。 当我运行该软件时,我在这段代码中遇到崩溃,这是由于一个函数尝试使用 std::co…