如何诊断由于资源不足而导致 CUDA 启动失败?
我在尝试启动 CUDA 内核(通过 PyCUDA)时遇到资源不足错误,我想知道是否可以让系统告诉我缺少哪个资源。显然系统知道什么资源已经耗尽,我也只想查…
Pycuda 搞乱了 numpy 矩阵转置
为什么转置矩阵在转换为 pycuda.gpuarray 时看起来有所不同? 你能重现这个吗?什么可能导致这种情况?我使用了错误的方法吗? 示例代码 from pycuda …
如何使用 Visual Profiler 分析 PyCuda 代码?
当我创建一个新会话并告诉 Visual Profiler 启动我的 python/pycuda 脚本时,我收到以下错误消息: Execution run #1 of program '' failed, exit cod…
Python 中的自动 CudaMat 转换
我正在考虑使用某种形式的 CUDA 来加速我的 python 代码,这些代码都是矩阵数学。目前我的代码正在使用 Python 和 Numpy,因此使用 PyCUDA 或 CudaMat…
让 Pycuda 在 2 个 GPU 上与 Mpi4py 一起工作
Closed. This question needs debugging details. It is not currently accepting answers. 编辑问题以包含所需行为、特定问题或错误以及重现问题所…
我在哪里可以找到“Cuda/PyCuda for Dummies”教程
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…
PyCUDA+Threading = 内核调用的无效句柄
我会尽力澄清这一点; 我有两节课; GPU(Object),用于对 GPU 功能的一般访问;multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…
使用 PyCUDA 进行 Python 多处理
我有一个问题,想要在多个 CUDA 设备上拆分,但我怀疑我当前的系统架构阻碍了我; 我设置的是一个 GPU 类,其中包含在 GPU 上执行操作的函数(这很奇…
pycuda.debug 实际上做了什么?
作为一个更大项目的一部分,我遇到了一个奇怪的一致错误,我无法理解它,但它是一个典型的“黑匣子”错误;当使用 cuda-gdb python -m pycuda.debug p…
PyCUDA:查询设备状态(特别是内存)
PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…
CUDA/PyCUDA:诊断在 cuda-gdb 下消失的启动失败
有人知道在 cuda-gdb 下运行时消失的内核启动失败的可能调查途径吗?内存分配符合规范,每次在同一内核的同一运行中启动都会失败,并且(到目前为止)…
PyCUDA GPUArray 基于切片的操作
PyCUDA 文档对于我们这些“非大师”类的人来说示例有点简单,但我想知道可用于 gpuarrays 上的数组操作的操作,即。如果我想 gpuarray 这个循环; m=n…
PyCUDA:设备代码中的 Pow 尝试使用 std::pow,失败
问题或多或少说明了一切。 calling a host function("std::pow ") from a __device__/__global__ function("_calc_psd") is not allowed 根据我的理解…
PyCUDA / Copperhead 似乎无法识别 64 位机器
目前我在铜斑蛇方面遇到了两个问题,我怀疑它们是相关的。 运行示例文件 (samples/axpy.py) 会生成许多小警告,但这个警告很突出。 g++ -pthread -fno…