cuda

cuda

文章 23 浏览 77

关于计算视觉分析器和用于分析的块数

在《Compute Visual Profiler 用户指南》第 51 页上,它指出: 请注意,如果数字 内核中的块小于或不是多处理器数量的倍数 多次运行的计数器值将不一…

在巴黎塔顶看东京樱花 2024-09-28 03:47:57 3 0

cuda内核中的函数

有什么方法可以在 cuda 内核中拥有一个函数吗?我的意思是我的 cuda 内核变得相当长并且在某一时刻很难调试。谢谢。…

拒绝两难 2024-09-28 01:45:23 1 0

CUDA 计数、减少和线程扭曲

我正在尝试创建一个 cuda 程序,通过缩减算法来计算长向量中的真值(由非零值定义)的数量。我得到了有趣的结果。我得到 0 或 (ceil(N/threadsPerBloc…

谁的新欢旧爱 2024-09-28 01:45:08 4 0

是否可以在 Compute Prof (OpenCL/CUDA) 中同时比较两个以上内核的执行情况

是否可以在 Compute Prof 中同时比较两个以上的内核执行情况?…

格子衫的從容 2024-09-28 01:26:22 4 0

CUDA 线程分配

我已经阅读了 CUDA 编程指南,但无法理解如下所示的线程分配方法: dim3 dimGrid( 2, 2, 1 ) dim3 dimBlock( 4, 2, 2 ) KernelFunction&lt&lt&lt dimG…

冰葑 2024-09-27 23:33:21 6 0

编程 cuda 内核时整数的大小是多少

我似乎无法在 Cuda 编程指南中找到这个简单问题的答案:When compiling a kernel with nvcc, What size integer is statements byshort, int, long, a…

小…红帽 2024-09-27 04:16:41 1 0

如何创建 CUDA dll?

我需要在我的应用程序中使用 cuda。但我无法创建 dll。这里有一些代码。 __global__ void calc(float *a, int n) { int idx = blockIdx.x * blockDim.…

撩心不撩汉 2024-09-27 04:00:18 2 0

CUDA 上的并行归约和查找索引

我有一个 20K 值的数组,我将其减少为 50 个块,每个块有 400 个线程。 num_blocks = 50 和 block_size = 400。 我的代码如下所示: getmax &lt&lt&lt…

入画浅相思 2024-09-26 21:18:06 3 0

如何使用 Mipmapping 将 CUDA 生成的 PBO 复制到纹理

我正在尝试将 PBO 复制到启用了自动 mipmapping 的纹理中,但似乎只生成了顶级纹理(换句话说,没有发生 mipmapping)。 我正在构建一个 PBO //Genera…

眼前雾蒙蒙 2024-09-26 16:46:27 7 0

cuda内核参数

cuda 内核 __global__ foo (int a, int b) { ... ... } 假设我有一个存储 a 和 b 的 。这是否占用每个线程的寄存器空间?…

水水月牙 2024-09-26 13:52:38 4 0

CUDA常量内存无效符号

struct d_struct { // stuff } __device__ __constant__ d_struct structs[SIZE] 当我调用 cudaMemcpyToSymbol("structs", &amph_struct, sizeof(d_st…

橪书 2024-09-26 09:00:14 2 0

如何成功读取 2D 纹理

我如何: 将 cudaMallocPitch 浮点内存绑定到 2D 纹理引用 将一些主机数据复制到设备上的 2D 数组 将 1 添加到纹理引用并写入 a.) Pitch 2D 数组或 b.…

深海里的那抹蓝 2024-09-26 06:44:04 5 0

计算教授的非相干和相干 gst/gld 场? (CUDA/OpenCL)

我正在使用 Compute Prof 3.2 和 Geforce GTX 280。我相信我的计算能力为 1.3。 此文件,似乎表明我应该能够看到这些字段,因为我使用的是 1.x 计算设…

洒一地阳光 2024-09-26 04:20:50 6 0

有没有支持CUDA的JVM实现?

有没有支持CUDA的JVM实现?请提供链接 =)…

倥絔 2024-09-26 02:29:42 4 0

cuda SM寄存器限制

我知道在一个 SM 上运行的块数量受到块数量、线程、共享内存和寄存器的限制。有没有什么策略可以避免寄存器过多?我的意思是我只是不想拥有太多,最终…

伤感在游骋 2024-09-26 01:17:27 4 0
更多

推荐作者

linfzu01

文章 0 评论 0

可遇━不可求

文章 0 评论 0

枕梦

文章 0 评论 0

qq_3LFa8Q

文章 0 评论 0

JP

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文