cuda

cuda

文章 23 浏览 77

C++ 的问题CUDA-Matlab 编译中的指针

嘿, 我有以下代码片段: double *f f = a_function(parameters...) printf("%f", *(f+1)) loopAry(f, 5) void loopAry(double *in, int size) { prin…

转瞬即逝 2024-11-06 03:34:37 1 0

OpenCL 中的 popcnt?

较新的 NVIDIA GPU 支持 __popc(x) 指令,该指令可计算 32 位寄存器中设置的位数。 我认为 99% OpenCL 不支持内联汇编器,除非它是供应商内核扩展。 1…

心碎的声音 2024-11-05 21:49:33 0 0

PyCUDA+Threading = 内核调用的无效句柄

我会尽力澄清这一点; 我有两节课; GPU(Object),用于对 GPU 功能的一般访问;multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…

赤濁 2024-11-05 18:17:49 1 0

CUDA:归约还是原子操作?

我正在编写一个 CUDA 内核,其中涉及计算给定矩阵上的最大值,并且我正在评估可能性。我能找到的最好方法是: 强制每个线程在共享内存中存储一​​个…

小红帽 2024-11-05 16:56:25 0 0

使用 JOCL 确定 GPU 上可用的全局内存?

我正在编写一个在 GPU 上运行的 JOCl.org(与 jogamps jocl 不同)。我们正在处理足够的数据,我需要小心保持在 GPU 的全局内存限制以下。为此,我需…

月下客 2024-11-05 16:44:57 0 0

库达 4.0 与 3.2

CUDA 4.0 比 3.2 快吗? 我对 CUDA 4.0 的新增功能不感兴趣,而是想知道如果使用 CUDA 4.0,内存分配和传输是否会更快。 谢谢…

友谊不毕业 2024-11-05 13:40:39 1 0

在 GPU 编程中使用条件时,工作项会执行什么?

如果您有工作项在波前执行,并且有一个条件,例如: if(x){ ... } else{ .... } 工作项执行什么?波前中的所有工作项都将执行第一个分支(即 x == tru…

巴黎盛开的樱花 2024-11-05 13:13:16 2 0

使用 PyCUDA 进行 Python 多处理

我有一个问题,想要在多个 CUDA 设备上拆分,但我怀疑我当前的系统架构阻碍了我; 我设置的是一个 GPU 类,其中包含在 GPU 上执行操作的函数(这很奇…

要走就滚别墨迹 2024-11-05 12:23:21 0 0

Matlab Mexfiles 和 Cuda:评估函数句柄

嘿, 我有一个 mex 文件,我想在 CUDA 的帮助下并行化。当前的功能是:我将函数句柄和大量“点”传递给 mex 文件,并以顺序模式(在 CPU 上)评估每个…

吃素的狼 2024-11-05 07:52:43 0 0

matlab 中 FT 图像与 cuda 中的差异

我正在尝试实现一个可以进行 2D 卷积的 matlab 代码。 matlab 代码首先将 3x3 内核置于图像大小的填充矩阵中。我在 C++ 代码中做了同样的事情。 我已…

放血 2024-11-05 06:28:01 0 0

将 matlab m 文件编译为可用的 C 函数

嘿, 有没有办法将 matlab m 函数编译(或者更好地说:“翻译”)为 C 函数,以便我可以在 mex 文件的 CUDA 内核中使用它? 多谢!…

倚栏听风 2024-11-05 05:26:18 0 0

CUDA设备指针操作

我在 CUDA C 中使用: float *devptr //... cudaMalloc(&ampdevptr, sizeofarray) cudaMemcpy(devptr, hostptr, sizeofarray, cudaMemcpyHostToDevice…

逐鹿 2024-11-05 04:09:26 1 0

GPU隐藏内存访问时间

我知道 GPU 通常具有较长的内存访问时间。然而,性能并没有受到太大影响,因为在等待内存访问时执行其他指令会“隐藏”访问时间。 我只是想知道,如果…

赴月观长安 2024-11-05 04:04:58 1 0

Cuda cudaMemcpy 和 cudaMalloc

我总是读到从 cpu 到 gpu 的分配和传输数据很慢。这是因为 cudaMalloc 很慢吗?是因为 cudaMemcpy 慢吗?或者是因为他们俩都很慢?…

走过海棠暮 2024-11-05 03:34:18 0 0

带有 mingw 的 cuda - 更新

我们一直在 Linux 中开发代码,但想编译 Windows 可执行文件。旧的非 GPU 版本可以在 Windows 中使用 mingw 进行良好的编译,因此我希望能够对 CUDA …

各自安好 2024-11-05 03:13:12 0 0
更多

推荐作者

lorenzathorton8

文章 0 评论 0

Zero

文章 0 评论 0

萧瑟寒风

文章 0 评论 0

mylayout

文章 0 评论 0

tkewei

文章 0 评论 0

17818769742

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文