如何从 PyCUDA 中现有的 numpy 数组创建页面锁定内存?
PyCUDA 帮助说明了如何创建空数组或归零数组,但没有说明如何创建将现有的 numpy 数组移动(?)到页锁定内存中。我是否需要获取 numpy 数组的指针并…
为什么将共享内存数组填充一列可以使内核速度提高 40%?
当共享内存数组填充一列时,为什么这个矩阵转置内核更快? 我在 PyCuda/Examples/MatrixTranspose 找到了内核。 源 import pycuda.gpuarray as gpuarr…
PyCUDA - 通过引用将矩阵从 python 传递到 C++ CUDA代码
我必须编写一个 PyCUDA 函数,该函数获取两个矩阵 Nx3 和 Mx3,并返回一个矩阵 NxM,但我无法弄清楚如何在不知道列数的情况下通过引用传递矩阵。 我的…
如何诊断由于资源不足而导致 CUDA 启动失败?
我在尝试启动 CUDA 内核(通过 PyCUDA)时遇到资源不足错误,我想知道是否可以让系统告诉我缺少哪个资源。显然系统知道什么资源已经耗尽,我也只想查…
Pycuda 搞乱了 numpy 矩阵转置
为什么转置矩阵在转换为 pycuda.gpuarray 时看起来有所不同? 你能重现这个吗?什么可能导致这种情况?我使用了错误的方法吗? 示例代码 from pycuda …
如何使用 Visual Profiler 分析 PyCuda 代码?
当我创建一个新会话并告诉 Visual Profiler 启动我的 python/pycuda 脚本时,我收到以下错误消息: Execution run #1 of program '' failed, exit cod…
Python 中的自动 CudaMat 转换
我正在考虑使用某种形式的 CUDA 来加速我的 python 代码,这些代码都是矩阵数学。目前我的代码正在使用 Python 和 Numpy,因此使用 PyCUDA 或 CudaMat…
让 Pycuda 在 2 个 GPU 上与 Mpi4py 一起工作
Closed. This question needs debugging details. It is not currently accepting answers. 编辑问题以包含所需行为、特定问题或错误以及重现问题所…
我在哪里可以找到“Cuda/PyCuda for Dummies”教程
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…
PyCUDA+Threading = 内核调用的无效句柄
我会尽力澄清这一点; 我有两节课; GPU(Object),用于对 GPU 功能的一般访问;multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…
使用 PyCUDA 进行 Python 多处理
我有一个问题,想要在多个 CUDA 设备上拆分,但我怀疑我当前的系统架构阻碍了我; 我设置的是一个 GPU 类,其中包含在 GPU 上执行操作的函数(这很奇…
pycuda.debug 实际上做了什么?
作为一个更大项目的一部分,我遇到了一个奇怪的一致错误,我无法理解它,但它是一个典型的“黑匣子”错误;当使用 cuda-gdb python -m pycuda.debug p…
PyCUDA:查询设备状态(特别是内存)
PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…
- 共 1 页
- 1