pycuda

pycuda

文章 0 浏览 1

pyCUDA 与 C 性能差异?

我是 CUDA 编程的新手,我想知道 pyCUDA 的性能与纯 C 实现的程序相比如何。 性能会大致相同吗?有什么我应该注意的瓶颈吗? 编辑: 我显然首先尝试用…

時窥 2024-12-12 14:37:12 0 0

如何从 PyCUDA 中现有的 numpy 数组创建页面锁定内存?

PyCUDA 帮助说明了如何创建空数组或归零数组,但没有说明如何创建将现有的 numpy 数组移动(?)到页锁定内存中。我是否需要获取 numpy 数组的指针并…

苏大泽ㄣ 2024-12-08 16:12:01 0 0

循环展开时出现“资源不足”错误

当我将内核中的展开循环从 8 个增加到 9 个时,它会因 资源不足 错误而中断。 我读到 如何我是否诊断由于资源不足而导致 CUDA 启动失败? 参数不匹配…

饮惑 2024-12-07 04:02:38 1 0

为什么将共享内存数组填充一列可以使内核速度提高 40%?

当共享内存数组填充一列时,为什么这个矩阵转置内核更快? 我在 PyCuda/Examples/MatrixTranspose 找到了内核。 源 import pycuda.gpuarray as gpuarr…

泛泛之交 2024-11-28 23:00:10 2 0

PyCUDA - 通过引用将矩阵从 python 传递到 C++ CUDA代码

我必须编写一个 PyCUDA 函数,该函数获取两个矩阵 Nx3 和 Mx3,并返回一个矩阵 NxM,但我无法弄清楚如何在不知道列数的情况下通过引用传递矩阵。 我的…

七禾 2024-11-28 01:41:24 1 0

如何诊断由于资源不足而导致 CUDA 启动失败?

我在尝试启动 CUDA 内核(通过 PyCUDA)时遇到资源不足错误,我想知道是否可以让系统告诉我缺少哪个资源。显然系统知道什么资源已经耗尽,我也只想查…

白馒头 2024-11-27 17:31:19 0 0

Pycuda 搞乱了 numpy 矩阵转置

为什么转置矩阵在转换为 pycuda.gpuarray 时看起来有所不同? 你能重现这个吗?什么可能导致这种情况?我使用了错误的方法吗? 示例代码 from pycuda …

往昔成烟 2024-11-27 08:33:26 0 0

如何使用 Visual Profiler 分析 PyCuda 代码?

当我创建一个新会话并告诉 Visual Profiler 启动我的 python/pycuda 脚本时,我收到以下错误消息: Execution run #1 of program '' failed, exit cod…

乖乖兔^ω^ 2024-11-26 18:34:07 0 0

Python 中的自动 CudaMat 转换

我正在考虑使用某种形式的 CUDA 来加速我的 python 代码,这些代码都是矩阵数学。目前我的代码正在使用 Python 和 Numpy,因此使用 PyCUDA 或 CudaMat…

[浮城] 2024-11-25 00:33:55 1 0

让 Pycuda 在 2 个 GPU 上与 Mpi4py 一起工作

Closed. This question needs debugging details. It is not currently accepting answers. 编辑问题以包含所需行为、特定问题或错误以及重现问题所…

枯叶蝶 2024-11-24 09:19:36 2 0

我在哪里可以找到“Cuda/PyCuda for Dummies”教程

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

空城旧梦 2024-11-08 03:23:42 4 0

PyCUDA+Threading = 内核调用的无效句柄

我会尽力澄清这一点; 我有两节课; GPU(Object),用于对 GPU 功能的一般访问;multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…

赤濁 2024-11-05 18:17:49 5 0

使用 PyCUDA 进行 Python 多处理

我有一个问题,想要在多个 CUDA 设备上拆分,但我怀疑我当前的系统架构阻碍了我; 我设置的是一个 GPU 类,其中包含在 GPU 上执行操作的函数(这很奇…

要走就滚别墨迹 2024-11-05 12:23:21 3 0

pycuda.debug 实际上做了什么?

作为一个更大项目的一部分,我遇到了一个奇怪的一致错误,我无法理解它,但它是一个典型的“黑匣子”错误;当使用 cuda-gdb python -m pycuda.debug p…

红焚 2024-11-03 07:45:52 3 0

PyCUDA:查询设备状态(特别是内存)

PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…

贪恋 2024-11-02 14:50:40 6 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文