第 7 页 - gpgpu - 文江博客

gpgpu

文章 0 浏览 5

Fermi GPU (GTX 580) 中分析执行指令和发出指令的奇怪结果

我的内核有这样的ptx版本： .version 2.2 .target sm_20, texmode_independent .entry histogram( .param .u32 .ptr .global .align 4 histogram_para…

泪眸﹌ 2024-11-19 01:43:34 6 0

使用 cudaHostAlloc 对我的情况有好处

我多次启动内核，直到找到解决方案。至少有一个方块可以找到解决方案。因此，当一个块找到解决方案时，它应该通知CPU找到了解决方案，以便CPU打印该…

淡看悲欢离合 2024-11-18 20:08:38 3 0

CUDA：我可以知道我是否有全局内存合并吗？

我使用的是 GeForce GTX 580（计算能力 2.0）。在我的程序中，我怀疑瓶颈是对内核中全局内存的访问。我怀疑这一点是因为所有计算都涉及通过索引全局…

入怼 2024-11-17 21:55:05 3 0

如何“串流”全局内存中的数据？

codeproject.com 展示第 2 部分：OpenCL™ – 内存空间指出全局内存应被视为流内存 [...]并且当流连续内存地址或内存访问模式可以利用内存子系统的全…

捎一片雪花 2024-11-17 13:02:19 4 0

CUDA memcheck 地址 - 如何确定代码中的位置？

cuda-memcheck 正在报告发布模式 CUDA 内核的此信息： ========= Error: process didn't terminate successfully ========= Invalid __global__ read …

微暖i 2024-11-16 18:41:06 7 0

在 GPU 硬件中实现的特殊数学函数

今天我了解到，在 NVIDIA GPU 中，顶点单元中有特殊的硬件函数，用于计算 3D 规则网格中的线性插值。我想知道这种类型是否还有更多，更重要的是，人们…

难得心□动 2024-11-15 22:44:09 4 0

tegra2 芯片上的 cuda 支持

我正在开发一个图像处理项目，该项目利用 cuda 进行 gpgpu 实现。我想知道 NVIDIA 的 tegra2 芯片上是否启用了 cuda 支持。…

雨落□心尘 2024-11-15 17:42:49 9 0

Cayman 科学计算架构中的本地数据存储与纹理缓存

我正在尝试在 ATI HD 6990 卡（Cayman 架构）上使用 AMD-APP-SDK 2.4 实现 GEMM 实现。优化技术之一是使用分块/平铺。在其实现中，如果我们将子矩阵…

ゃ懵逼小萝莉 2024-11-15 17:35:32 6 0

Opengl Es如何用于gpgpu实现

我想使用 Opengl Es 进行图像处理代码的 gpgpu 实现。我想知道我可以使用 Opengl Es 来实现此目的吗？如果可以的话，哪个版本的 Opengl Es 将更适合此…

孤城病女 2024-11-15 07:01:48 4 0

GPU性能要求，什么是最好的解决方案？

我从事一个音频处理项目，需要进行大量基本计算（+、-、*），例如 FFT（快速傅里叶变换）计算。我们正在考虑使用显卡来加速这些计算。但我们不知道这…

っ〆星空下的拥抱 2024-11-14 19:26:44 6 0

Myers Diff 适合在 GPU 上运行吗？

我有兴趣通过在 GPU（即使用 OpenCL）上运行来实现更快的 Myers diff 实现。我对该算法有很好的了解，但对 GPU 编程还是新手。我的预感是 GPU 的性能…

甜尕妞 2024-11-14 05:12:40 4 0

使用 flash 3d api 进行快速算术？

一些计算密集型软件现在使用 GPU 来解决数学问题。现在闪存有了 GPU 支持，是否可以使用闪存来解决数学问题？该怎么办呢。换句话说，闪存是否公开了…

伴我老 2024-11-11 16:48:50 5 0

2D/3D CUDA 块如何划分为扭曲？

如果我从一个块具有尺寸的网格开始我的内核： dim3 block_dims(16,16); 网格块现在如何分割成扭曲？这样一个块的前两行是否形成一个扭曲，或者前两列…

万劫不复 2024-11-10 11:42:22 7 0

我什么时候可以发布源 PBO？

我正在使用 PBO 在 CPU 和 GPU 之间异步移动数据。当从 GPU 移动时，我知道在 PBO 上调用 glMapBuffer 后可以删除源纹理。然而，反过来又如何呢？我…

乞讨 2024-11-09 15:00:04 7 0

Boost::thread() 和 Nvidia CUDA 是否存在某种不兼容性？

我正在开发一个通用的流式 CUDA 内核执行框架，它允许并行数据复制和复制。在 GPU 上执行。目前，我正在 C++ 静态函数包装器中调用 cuda 内核，因此…

浪荡不羁 2024-11-09 05:58:31 8 0

共 15 页
上一页
5
6
7
8
9
下一页

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

gpgpu

Fermi GPU (GTX 580) 中分析执行指令和发出指令的奇怪结果

使用 cudaHostAlloc 对我的情况有好处

CUDA：我可以知道我是否有全局内存合并吗？

如何“串流”全局内存中的数据？

CUDA memcheck 地址 - 如何确定代码中的位置？

在 GPU 硬件中实现的特殊数学函数

tegra2 芯片上的 cuda 支持

Cayman 科学计算架构中的本地数据存储与纹理缓存

Opengl Es如何用于gpgpu实现

GPU性能要求，什么是最好的解决方案？

Myers Diff 适合在 GPU 上运行吗？

使用 flash 3d api 进行快速算术？

2D/3D CUDA 块如何划分为扭曲？

我什么时候可以发布源 PBO？

Boost::thread() 和 Nvidia CUDA 是否存在某种不兼容性？

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接