gpgpu

gpgpu

文章 0 浏览 5

Fermi GPU (GTX 580) 中分析执行指令和发出指令的奇怪结果

我的内核有这样的ptx版本: .version 2.2 .target sm_20, texmode_independent .entry histogram( .param .u32 .ptr .global .align 4 histogram_para…

泪眸﹌ 2024-11-19 01:43:34 6 0

使用 cudaHostAlloc 对我的情况有好处

我多次启动内核,直到找到解决方案。至少有一个方块可以找到解决方案。 因此,当一个块找到解决方案时,它应该通知CPU找到了解决方案,以便CPU打印该…

淡看悲欢离合 2024-11-18 20:08:38 3 0

CUDA:我可以知道我是否有全局内存合并吗?

我使用的是 GeForce GTX 580(计算能力 2.0)。 在我的程序中,我怀疑瓶颈是对内核中全局内存的访问。我怀疑这一点是因为所有计算都涉及通过索引全局…

入怼 2024-11-17 21:55:05 3 0

如何“串流”全局内存中的数据?

codeproject.com 展示第 2 部分:OpenCL™ – 内存空间 指出全局内存应被视为流内存 [...]并且当流连续内存地址或内存访问模式可以利用内存子系统的全…

捎一片雪花 2024-11-17 13:02:19 4 0

CUDA memcheck 地址 - 如何确定代码中的位置?

cuda-memcheck 正在报告发布模式 CUDA 内核的此信息: ========= Error: process didn't terminate successfully ========= Invalid __global__ read …

微暖i 2024-11-16 18:41:06 7 0

在 GPU 硬件中实现的特殊数学函数

今天我了解到,在 NVIDIA GPU 中,顶点单元中有特殊的硬件函数,用于计算 3D 规则网格中的线性插值。我想知道这种类型是否还有更多,更重要的是,人们…

难得心□动 2024-11-15 22:44:09 4 0

tegra2 芯片上的 cuda 支持

我正在开发一个图像处理项目,该项目利用 cuda 进行 gpgpu 实现。我想知道 NVIDIA 的 tegra2 芯片上是否启用了 cuda 支持。…

雨落□心尘 2024-11-15 17:42:49 9 0

Cayman 科学计算架构中的本地数据存储与纹理缓存

我正在尝试在 ATI HD 6990 卡(Cayman 架构)上使用 AMD-APP-SDK 2.4 实现 GEMM 实现。 优化技术之一是使用分块/平铺。 在其实现中,如果我们将子矩阵…

ゃ懵逼小萝莉 2024-11-15 17:35:32 6 0

Opengl Es如何用于gpgpu实现

我想使用 Opengl Es 进行图像处理代码的 gpgpu 实现。我想知道我可以使用 Opengl Es 来实现此目的吗?如果可以的话,哪个版本的 Opengl Es 将更适合此…

孤城病女 2024-11-15 07:01:48 4 0

GPU性能要求,什么是最好的解决方案?

我从事一个音频处理项目,需要进行大量基本计算(+、-、*),例如 FFT(快速傅里叶变换)计算。 我们正在考虑使用显卡来加速这些计算。但我们不知道这…

っ〆星空下的拥抱 2024-11-14 19:26:44 6 0

Myers Diff 适合在 GPU 上运行吗?

我有兴趣通过在 GPU(即使用 OpenCL)上运行来实现更快的 Myers diff 实现。我对该算法有很好的了解,但对 GPU 编程还是新手。我的预感是 GPU 的性能…

甜尕妞 2024-11-14 05:12:40 4 0

使用 flash 3d api 进行快速算术?

一些计算密集型软件现在使用 GPU 来解决数学问题。现在闪存有了 GPU 支持,是否可以使用闪存来解决数学问题?该怎么办呢。 换句话说,闪存是否公开了…

伴我老 2024-11-11 16:48:50 5 0

2D/3D CUDA 块如何划分为扭曲?

如果我从一个块具有尺寸的网格开始我的内核: dim3 block_dims(16,16); 网格块现在如何分割成扭曲?这样一个块的前两行是否形成一个扭曲,或者前两列…

万劫不复 2024-11-10 11:42:22 7 0

我什么时候可以发布源 PBO?

我正在使用 PBO 在 CPU 和 GPU 之间异步移动数据。 当从 GPU 移动时,我知道在 PBO 上调用 glMapBuffer 后可以删除源纹理。 然而,反过来又如何呢?我…

乞讨 2024-11-09 15:00:04 7 0

Boost::thread() 和 Nvidia CUDA 是否存在某种不兼容性?

我正在开发一个通用的流式 CUDA 内核执行框架,它允许并行数据复制和复制。在 GPU 上执行。 目前,我正在 C++ 静态函数包装器中调用 cuda 内核,因此…

浪荡不羁 2024-11-09 05:58:31 8 0
更多

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待"谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文