第 4 页 - cuda - 文江博客

cuda

文章 23 浏览 77

C++ 的问题CUDA-Matlab 编译中的指针

嘿，我有以下代码片段： double *f f = a_function(parameters...) printf("%f", *(f+1)) loopAry(f, 5) void loopAry(double *in, int size) { prin…

转瞬即逝 2024-11-06 03:34:37 1 0

OpenCL 中的 popcnt？

较新的 NVIDIA GPU 支持 __popc(x) 指令，该指令可计算 32 位寄存器中设置的位数。我认为 99% OpenCL 不支持内联汇编器，除非它是供应商内核扩展。 1…

心碎的声音 2024-11-05 21:49:33 0 0

PyCUDA+Threading = 内核调用的无效句柄

我会尽力澄清这一点；我有两节课； GPU(Object)，用于对 GPU 功能的一般访问；multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…

赤濁 2024-11-05 18:17:49 1 0

CUDA：归约还是原子操作？

我正在编写一个 CUDA 内核，其中涉及计算给定矩阵上的最大值，并且我正在评估可能性。我能找到的最好方法是：强制每个线程在共享内存中存储一个…

小红帽 2024-11-05 16:56:25 0 0

使用 JOCL 确定 GPU 上可用的全局内存？

我正在编写一个在 GPU 上运行的 JOCl.org（与 jogamps jocl 不同）。我们正在处理足够的数据，我需要小心保持在 GPU 的全局内存限制以下。为此，我需…

月下客 2024-11-05 16:44:57 0 0

库达 4.0 与 3.2

CUDA 4.0 比 3.2 快吗？我对 CUDA 4.0 的新增功能不感兴趣，而是想知道如果使用 CUDA 4.0，内存分配和传输是否会更快。谢谢…

友谊不毕业 2024-11-05 13:40:39 1 0

在 GPU 编程中使用条件时，工作项会执行什么？

如果您有工作项在波前执行，并且有一个条件，例如： if(x){ ... } else{ .... } 工作项执行什么？波前中的所有工作项都将执行第一个分支（即 x == tru…

巴黎盛开的樱花 2024-11-05 13:13:16 2 0

使用 PyCUDA 进行 Python 多处理

我有一个问题，想要在多个 CUDA 设备上拆分，但我怀疑我当前的系统架构阻碍了我；我设置的是一个 GPU 类，其中包含在 GPU 上执行操作的函数（这很奇…

要走就滚别墨迹 2024-11-05 12:23:21 0 0

Matlab Mexfiles 和 Cuda：评估函数句柄

嘿，我有一个 mex 文件，我想在 CUDA 的帮助下并行化。当前的功能是：我将函数句柄和大量“点”传递给 mex 文件，并以顺序模式（在 CPU 上）评估每个…

吃素的狼 2024-11-05 07:52:43 0 0

matlab 中 FT 图像与 cuda 中的差异

我正在尝试实现一个可以进行 2D 卷积的 matlab 代码。 matlab 代码首先将 3x3 内核置于图像大小的填充矩阵中。我在 C++ 代码中做了同样的事情。我已…

放血 2024-11-05 06:28:01 0 0

将 matlab m 文件编译为可用的 C 函数

嘿，有没有办法将 matlab m 函数编译（或者更好地说：“翻译”）为 C 函数，以便我可以在 mex 文件的 CUDA 内核中使用它？多谢！…

倚栏听风 2024-11-05 05:26:18 0 0

CUDA设备指针操作

我在 CUDA C 中使用： float *devptr //... cudaMalloc(&ampdevptr, sizeofarray) cudaMemcpy(devptr, hostptr, sizeofarray, cudaMemcpyHostToDevice…

逐鹿 2024-11-05 04:09:26 1 0

GPU隐藏内存访问时间

我知道 GPU 通常具有较长的内存访问时间。然而，性能并没有受到太大影响，因为在等待内存访问时执行其他指令会“隐藏”访问时间。我只是想知道，如果…

赴月观长安 2024-11-05 04:04:58 1 0

Cuda cudaMemcpy 和 cudaMalloc

我总是读到从 cpu 到 gpu 的分配和传输数据很慢。这是因为 cudaMalloc 很慢吗？是因为 cudaMemcpy 慢吗？或者是因为他们俩都很慢？…

走过海棠暮 2024-11-05 03:34:18 0 0

带有 mingw 的 cuda - 更新

我们一直在 Linux 中开发代码，但想编译 Windows 可执行文件。旧的非 GPU 版本可以在 Windows 中使用 mingw 进行良好的编译，因此我希望能够对 CUDA …

各自安好 2024-11-05 03:13:12 0 0

共 39 页
上一页
2
3
4
5
6
下一页

lorenzathorton8

文章 0 评论 0

关注

Zero

文章 0 评论 0

关注

萧瑟寒风

文章 0 评论 0

关注

mylayout

文章 0 评论 0

关注

tkewei

文章 0 评论 0

关注

17818769742

文章 0 评论 0

友情链接

文江博客

cuda

C++ 的问题CUDA-Matlab 编译中的指针

OpenCL 中的 popcnt？

PyCUDA+Threading = 内核调用的无效句柄

CUDA：归约还是原子操作？

使用 JOCL 确定 GPU 上可用的全局内存？

库达 4.0 与 3.2

在 GPU 编程中使用条件时，工作项会执行什么？

使用 PyCUDA 进行 Python 多处理

Matlab Mexfiles 和 Cuda：评估函数句柄

matlab 中 FT 图像与 cuda 中的差异

将 matlab m 文件编译为可用的 C 函数

CUDA设备指针操作

GPU隐藏内存访问时间

Cuda cudaMemcpy 和 cudaMalloc

带有 mingw 的 cuda - 更新

热门标签

推荐作者

lorenzathorton8

Zero

萧瑟寒风

mylayout

tkewei

17818769742

友情链接