有什么方法可以找出和/或限制 Windows 中进程的 GPU 使用情况吗?
我想在某些机器上启动 CPU 和 GPU 密集型进程,但这些进程不得干扰用户的任务。因此,我需要限制或至少检测我的进程对 GPU 的使用情况。这些进程是闭…
弄清楚 cuda 内核有多少个块和线程,以及如何使用它们
我一直在试图弄清楚如何制作一个我认为简单的内核来取二维矩阵中值的平均值,但我在直接思考过程中遇到了一些问题。 根据我的 deviceQuery 输出,我的…
一次 I/O 执行速度比一次读取一点要慢
我正在致力于优化和算法,我们正准备使用 cuda 将其放在 GPU 上。 I/O 部分从 3 个不同的图像中读取,一次读取一行。这正好位于在图像上运行过滤器的…
我可以将特定数据预取到 CUDA 内核中的特定缓存级别吗?
据我所知,Fermi GPU 支持预取 L1 或 L2 缓存。然而,在CUDA参考手册中我找不到任何相关内容。 CUDA 允许我的内核代码将特定数据预取到特定级别的缓存…
通过CUDA线程复制全局内存
我需要通过 CUDA 线程(而不是从主机)将全局内存中的一个数组复制到全局内存中的另一个数组。 我的代码如下: __global__ void copy_kernel(int *g_d…
NVIDIA 与 AMD:GPGPU 性能
我想听听具有这两种编码经验的人的意见。就我个人而言,我只拥有 NVIDIA 的经验。 NVIDIA CUDA 似乎比竞争对手更受欢迎。 (仅计算该论坛上的问题标签…
在 iPhone 上进行 GPU 加速计算 (GPGPU) 的资源?
我对在 iOS 中进行 GPU 加速计算(适用于 iPhone 3GS 和 4)感兴趣。不幸的是,这两个设备都不支持 OpenCL,因此似乎唯一的选择是将程序数据表示为图…
基于 GPU 搜索图上两个节点之间的所有可能路径
我的工作广泛使用 Migliore、Martorana 和 Sciortino 的算法来查找所有可能的简单路径,即在图中没有多次遇到节点的路径,如下所示: 一种查找图中两…
如何针对CUDA优化Conway的生命游戏?
我已经为 Conway 的生命游戏编写了这个 CUDA 内核: __global__ void gameOfLife(float* returnBuffer, int width, int height) { unsigned int x = b…
CUDA 和 MATLAB 用于循环优化
我将尝试使用 CUDA 优化用 MATLAB 编写的一些代码。我最近开始进行 CUDA 编程,但我对它的工作原理有了一个大概的了解。 所以,假设我想将两个矩阵相…
带 VDPAU 的 GStreamer(使用 nVidia 卡进行 h264 加速)
我使用最新版本的 gstreamer 插件很糟糕,我想尝试 VDPAU。 我用搅拌机基金会的大兔子电影进行了测试。 我尝试过这个命令: gst-launch-0.10 filesrc=…