使用纹理内存在 CUDA 中进行过滤
我在 CUDA 中使用纹理内存进行图像过滤: texture<unsigned char> texMem //deceleration cudaBindTexture( NULL, texMem,d_inputImage,imageSize…
GPU 上的并行冒泡排序
我正在使用 CUDA 实现简单的冒泡排序算法,我有一个问题。 我执行以下代码以交换数组中的 2 个连续元素: if(a[threadIdx.x]>a[threadIdx.x + 1]) S…
设置cudaDeviceProperty:cudaKernelExecTimeoutEnabled
是否可以在运行时将设备属性 cudaKernelExecTimeoutEnabled 设置为 0?目前它是 1,因为我还在其上运行 X 服务器。问题是,我的线程超时。…
无法重载 make_uint4 函数
我尝试按以下方式重载 make_uint4: namespace A { namespace B { inline __host__ __device__ uint4 make_uint4(uint2 a, uint2 b) { return make_ui…
Microsoft Visual Studio 未将我的 CUDA .obj 文件链接到我的 .lib
因此,我们最近将项目升级为使用 Microsoft Visual Studio 2010,但我们的 CUDA 项目遇到了一些问题。 我确实安装了 2008,并且正在使用 vc90 工具包…
CUDA - 这个循环在做什么
嘿 我在网站上看到过这个示例内核 __global__ void loop1( int N, float alpha, float* x, float* y ) { int i int i0 = blockIdx.x*blockDim.x + thr…
CUDA:头文件中使用的 __device__ 函数出现 LNK2005 错误
我有一个在头文件中定义的设备函数。它位于头文件中的原因是因为它由全局内核使用,而该内核需要位于头文件中,因为它是模板内核。 当此头文件包含在 …
CUDA - 多个内核来计算单个值
嘿,我正在尝试编写一个内核,本质上是在 C 中执行以下操作 float sum = 0.0 for(int i = 0 i < N i++){ sum += valueArray[i]*valueArray[i] } sum…
CUDA 和 HPC 中的一维问题
我正在寻找 CUDA 和 HPC 中的一些一维问题,例如 Black Scholes。 我所说的一维问题是指所有工作都在一维数组上完成的问题。虽然矩阵乘法可以用这种方…