我们能否对 CUDA 或 OpenCL 与 CPU 性能相比的速度进行基准测试?
与一般的单处理器核心相比,CUDA 或 OpenCL 代码上的算法运行速度能快多少? (考虑到算法是针对 CPU 和 GPU 目标编写和优化的)。 我知道这取决于显…
结构问题,CUDA C/C++和VS 2008
嘿那里...所以我在这里使用 VS2008,使用 CUDA C 进行编程。我已经安装并运行了 3.2 工具包。 现在我的问题是,我有一个这样的文件: #ifndef _cuda_r…
CUDA 扭曲发散和时钟周期
我读到,在具有 8 个 SP 的 SM 上,在执行一条指令期间,warp 中的每个线程都映射到 8 个 SP 中的每一个。因此,warp 在 32/8 = 4 个时钟周期内执行。…
使用VS2010打开CUDA SDK示例时出现错误
我已经安装了cudatoolkit_3.2.16_win_64和gpucomputingsdk_3.2.16_win_64。当我选择 SDK 的示例时,出现以下错误: 导入的项目“C:\Program Files (x8…
CUDA on Thrust:如何实现优先级队列
我的计划是使用皮尔逊相关性计算距离矩阵,并从距离矩阵中获取每个节点的 q- 最近邻 (q=ln(n)) 并将它们放入结果向量中。我在 C++ 中使用相关函数循环…
在 GPU 上运行的计算任务会对图形性能产生负面影响吗?
我从来没有做过 GPU 编程,但终于买了一张 Nvidia 卡来试验。然而,该卡也驱动我的显示器。我的问题是在卡上运行通用计算任务是否会对图形性能产生负…
带 VDPAU 的 GStreamer(使用 nVidia 卡进行 h264 加速)
我使用最新版本的 gstreamer 插件很糟糕,我想尝试 VDPAU。 我用搅拌机基金会的大兔子电影进行了测试。 我尝试过这个命令: gst-launch-0.10 filesrc=…
新的 Amazon EC2 集群 GPU 实例体验如何?
亚马逊发布了 EC2 - 集群 GPU 实例,我想知道您对此有何体验?它是否稳定,在部署 CUDA 代码之前是否需要大量时间来安装新的驱动程序、SDK 等?…
当编译器未提供 uint8_t 时,什么是更好的替代方案?
我正在使用 nvcc 编译 CUDA 内核。不幸的是,nvcc 似乎不支持 uint8_t,尽管它确实支持 int8_t(!)。出于可移植性、可读性和理智的原因,我宁愿不使…
CUDA 分析(解释 gst/gld 请求)
cudaprof 中曾经有用于全局内存的分析计数器(gst_coherent、gst_incoherent、gld_coherent、gld_incoherent),这些计数器对我来说非常有用且清晰,…