PyCUDA——导入 pycuda.driver 时出现问题
Windows 10 Python 3.8 CUDA 11.5 我已经从这个文件安装了我认为匹配的 pycuda: pycuda-2021.1+cuda115-cp38-cp38-win_amd64.whl 这个简单的示例失…
使用 Cuda 测试多个阵列的组合
我用 php 编写了以下代码,并一直在阅读 Cuda 以利用我的旧 Geforce 8800 Ultra 的 GPU 处理能力。如何将此嵌套组合测试转换为 Cuda 并行处理代码(如…
Windows 7 x64 位 Visual Studio2010 上的 pycuda
我花了一个多星期的时间试图在我的 win7 x64 位机器上追踪 pycuda 的清晰/干净安装,并发现 http://wiki.tiker.net/PyCuda/Installation/Windows 我可…
cuda、pycuda -- 如何编写复数 -- 错误:类“cuComplex”没有成员“i”
我在 cuda、pycuda 中使用复数有困难。 我在 C 中有这个: #include typedef std::complex cmplx; .... cmplx j(0.,1.); 另外,在相同的代码中: #inc…
使用 pycuda (lerp) 进行线性插值
我是一个刚刚接触 pyCUDA 的休闲 Python 爱好者。我试图弄清楚如何使用 pyCUDA 实现线性插值(lerp)。 CUDA CG函数为: http://http.developer.nvidi…
pycuda——如何处理“包括库”
我有一个c++代码。我用cuda修改了它。但是,我想使用Pycuda。 该代码例如: #include #include #include #include typedef std::complex cmplx; typed…
pycuda --“未设置 CUDA_ROOT,并且 nvcc 不在路径中。”
虽然我已经安装了 pycuda 并使用它,但它开始(不做某事)不起作用。所以,我尝试再次安装,但是当我正在做的时候 python configure.py --cuda-root=/…
尽管代码中没有双精度,Cuda 将双精度降级为浮点错误
我正在使用 PyCUDA 编写内核。我的 GPU 设备仅支持计算能力 1.1 (arch sm_11),因此我只能在代码中使用浮点数。我已经付出了巨大的努力来确保我使用浮…
如何从 PyCUDA 中现有的 numpy 数组创建页面锁定内存?
PyCUDA 帮助说明了如何创建空数组或归零数组,但没有说明如何创建将现有的 numpy 数组移动(?)到页锁定内存中。我是否需要获取 numpy 数组的指针并…
为什么将共享内存数组填充一列可以使内核速度提高 40%?
当共享内存数组填充一列时,为什么这个矩阵转置内核更快? 我在 PyCuda/Examples/MatrixTranspose 找到了内核。 源 import pycuda.gpuarray as gpuarr…
PyCUDA - 通过引用将矩阵从 python 传递到 C++ CUDA代码
我必须编写一个 PyCUDA 函数,该函数获取两个矩阵 Nx3 和 Mx3,并返回一个矩阵 NxM,但我无法弄清楚如何在不知道列数的情况下通过引用传递矩阵。 我的…