pycuda

pycuda

文章 0 浏览 2

PyCUDA——导入 pycuda.driver 时出现问题

Windows 10 Python 3.8 CUDA 11.5 我已经从这个文件安装了我认为匹配的 pycuda: pycuda-2021.1+cuda115-cp38-cp38-win_amd64.whl 这个简单的示例失…

独守阴晴ぅ圆缺 2025-01-10 23:22:27 0 0

如何在pycuda中设置流的优先级?

标题说明了一切,但这是我的问题的更详细信息: 我正在用 python + pycuda 实现一个有限元求解器,它应该在分布式系统上运行。 为了隐藏通信延迟,我…

┊风居住的梦幻卍 2025-01-09 14:55:46 0 0

使用 Cuda 测试多个阵列的组合

我用 php 编写了以下代码,并一直在阅读 Cuda 以利用我的旧 Geforce 8800 Ultra 的 GPU 处理能力。如何将此嵌套组合测试转换为 Cuda 并行处理代码(如…

看轻我的陪伴 2025-01-02 06:31:01 0 0

Windows 7 x64 位 Visual Studio2010 上的 pycuda

我花了一个多星期的时间试图在我的 win7 x64 位机器上追踪 pycuda 的清晰/干净安装,并发现 http://wiki.tiker.net/PyCuda/Installation/Windows 我可…

屋顶上的小猫咪 2025-01-01 22:01:08 0 0

如何告诉 PyCUDA 重用早期内核的内存?

我的程序有两个内核,第二个内核应该使用已经上传的输入数据和第一个内核的结果,这样我就可以节省内存传输。我该如何存档这个? 这就是我启动内核的…

公布 2025-01-01 21:55:10 0 0

cuda、pycuda -- 如何编写复数 -- 错误:类“cuComplex”没有成员“i”

我在 cuda、pycuda 中使用复数有困难。 我在 C 中有这个: #include typedef std::complex cmplx; .... cmplx j(0.,1.); 另外,在相同的代码中: #inc…

℉服软 2024-12-27 02:09:14 0 0

使用 pycuda (lerp) 进行线性插值

我是一个刚刚接触 pyCUDA 的休闲 Python 爱好者。我试图弄清楚如何使用 pyCUDA 实现线性插值(lerp)。 CUDA CG函数为: http://http.developer.nvidi…

演多会厌 2024-12-25 07:27:55 3 0

pycuda——如何处理“包括库”

我有一个c++代码。我用cuda修改了它。但是,我想使用Pycuda。 该代码例如: #include #include #include #include typedef std::complex cmplx; typed…

紫竹語嫣☆ 2024-12-22 13:26:05 0 0

pycuda --“未设置 CUDA_ROOT,并且 nvcc 不在路径中。”

虽然我已经安装了 pycuda 并使用它,但它开始(不做某事)不起作用。所以,我尝试再次安装,但是当我正在做的时候 python configure.py --cuda-root=/…

不交电费瞎发啥光 2024-12-19 11:48:55 1 0

尽管代码中没有双精度,Cuda 将双精度降级为浮点错误

我正在使用 PyCUDA 编写内核。我的 GPU 设备仅支持计算能力 1.1 (arch sm_11),因此我只能在代码中使用浮点数。我已经付出了巨大的努力来确保我使用浮…

ゃ懵逼小萝莉 2024-12-18 15:07:58 1 0

pyCUDA 与 C 性能差异?

我是 CUDA 编程的新手,我想知道 pyCUDA 的性能与纯 C 实现的程序相比如何。 性能会大致相同吗?有什么我应该注意的瓶颈吗? 编辑: 我显然首先尝试用…

時窥 2024-12-12 14:37:12 2 0

如何从 PyCUDA 中现有的 numpy 数组创建页面锁定内存?

PyCUDA 帮助说明了如何创建空数组或归零数组,但没有说明如何创建将现有的 numpy 数组移动(?)到页锁定内存中。我是否需要获取 numpy 数组的指针并…

苏大泽ㄣ 2024-12-08 16:12:01 2 0

循环展开时出现“资源不足”错误

当我将内核中的展开循环从 8 个增加到 9 个时,它会因 资源不足 错误而中断。 我读到 如何我是否诊断由于资源不足而导致 CUDA 启动失败? 参数不匹配…

饮惑 2024-12-07 04:02:38 3 0

为什么将共享内存数组填充一列可以使内核速度提高 40%?

当共享内存数组填充一列时,为什么这个矩阵转置内核更快? 我在 PyCuda/Examples/MatrixTranspose 找到了内核。 源 import pycuda.gpuarray as gpuarr…

泛泛之交 2024-11-28 23:00:10 3 0

PyCUDA - 通过引用将矩阵从 python 传递到 C++ CUDA代码

我必须编写一个 PyCUDA 函数,该函数获取两个矩阵 Nx3 和 Mx3,并返回一个矩阵 NxM,但我无法弄清楚如何在不知道列数的情况下通过引用传递矩阵。 我的…

七禾 2024-11-28 01:41:24 4 0
更多

推荐作者

忆悲凉

文章 0 评论 0

hgfg1645

文章 0 评论 0

qq_qLPLYi

文章 0 评论 0

戏舞

文章 0 评论 0

殊姿

文章 0 评论 0

﹂绝世的画

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文