gpgpu

gpgpu

文章 0 浏览 4

CUDA - 复制到对象数组中的数组

我有一个 CUDA 应用程序,正在处理一组对象;每个对象都有一个指向 std::pair 数组的指针。我正在尝试 cudaMemcpy 对象数组,然后 cudaMemcpy 对每个…

痕至 2024-11-27 14:58:05 2 0

CUDA似乎达到了极限,但那是什么极限呢?

我有一个 CUDA 程序,似乎达到了某些资源的某种限制,但我无法弄清楚该资源是什么。这是内核函数: __global__ void DoCheck(float2* points, int* se…

你又不是我 2024-11-27 12:21:17 1 0

Cuda 中的 CImg 库

我正在 VS2008、Win 7 上的 CUDA C 中编写代码。我得到了一个要显示为图像的浮点数矩阵..我将其保存为 .bin 文件并将其加载到一个单独的 .cpp 文件中…

万劫不复 2024-11-27 03:59:00 1 0

如何测量矩阵乘法内核的 gflops?

在《大规模并行处理器编程》一书中,gflop 的数量用于比较不同矩阵乘法内核的效率。我如何在我自己的机器上为我自己的内核计算这个值? 我在 NVIDIA …

樱娆 2024-11-27 02:53:32 0 0

GPU序列化分解

据此, http://www.nvidia.co.uk /content/PDF/isc-2011/Ziegler.pdf,我理解GPU文献中的重放意味着序列化。但影响连载数量的因素有哪些呢? 为此,我…

倾城花音 2024-11-25 08:03:02 1 0

GPU中缓存未命中的变化

我一直在玩弄一个 OpenCL 内核,它访问 7 个全局内存缓冲区,对值执行一些操作并将结果存储回第 8 个全局内存缓冲区。正如我所观察到的,随着输入大小…

能否归途做我良人 2024-11-25 05:06:37 1 0

GPU 中的活动扭曲数量 (Fermi)

我有一个关于 GPU 中的活动扭曲的快速问题(我更愿意在费米中知道它)。 对于特定的内核,SM中任何周期的活动warp数量在内核的整个执行时间内是否相同…

挽清梦 2024-11-24 04:18:58 1 0

GPU 中的同步

我对 GPU 如何执行同步有一些疑问。 据我所知,当一个扭曲遇到障碍时(假设它在 OpenCL 中),它知道同一组的其他扭曲还没有到达那里。所以还得等。但…

A君 2024-11-19 19:21:07 5 0

cudamalloc 比 cudamecpy 慢吗?

我正在编写一个需要时间高效的代码,因此使用 Cufft 来实现此目的,但是当我尝试并行计算非常大的数据的 fft 时,它比 cpu fftw 慢,并且在找到每个时…

栀子花开つ 2024-11-19 16:30:04 2 0

GPU中的上下文切换机制是怎样的?

据我所知,GPU 在扭曲之间切换以隐藏内存延迟。但我想知道在什么情况下,扭曲会被切换出去?例如,如果扭曲执行加载,并且数据已经在缓存中。那么扭曲…

时光病人 2024-11-19 08:07:17 3 0

Fermi GPU (GTX 580) 中分析执行指令和发出指令的奇怪结果

我的内核有这样的ptx版本: .version 2.2 .target sm_20, texmode_independent .entry histogram( .param .u32 .ptr .global .align 4 histogram_para…

泪眸﹌ 2024-11-19 01:43:34 4 0

使用 cudaHostAlloc 对我的情况有好处

我多次启动内核,直到找到解决方案。至少有一个方块可以找到解决方案。 因此,当一个块找到解决方案时,它应该通知CPU找到了解决方案,以便CPU打印该…

淡看悲欢离合 2024-11-18 20:08:38 2 0

CUDA:我可以知道我是否有全局内存合并吗?

我使用的是 GeForce GTX 580(计算能力 2.0)。 在我的程序中,我怀疑瓶颈是对内核中全局内存的访问。我怀疑这一点是因为所有计算都涉及通过索引全局…

入怼 2024-11-17 21:55:05 1 0

如何“串流”全局内存中的数据?

codeproject.com 展示第 2 部分:OpenCL™ – 内存空间 指出全局内存应被视为流内存 [...]并且当流连续内存地址或内存访问模式可以利用内存子系统的全…

捎一片雪花 2024-11-17 13:02:19 1 0

CUDA memcheck 地址 - 如何确定代码中的位置?

cuda-memcheck 正在报告发布模式 CUDA 内核的此信息: ========= Error: process didn't terminate successfully ========= Invalid __global__ read …

微暖i 2024-11-16 18:41:06 5 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文