结构问题,CUDA C/C++和VS 2008
嘿那里...所以我在这里使用 VS2008,使用 CUDA C 进行编程。我已经安装并运行了 3.2 工具包。 现在我的问题是,我有一个这样的文件: #ifndef _cuda_r…
CUDA 扭曲发散和时钟周期
我读到,在具有 8 个 SP 的 SM 上,在执行一条指令期间,warp 中的每个线程都映射到 8 个 SP 中的每一个。因此,warp 在 32/8 = 4 个时钟周期内执行。…
使用VS2010打开CUDA SDK示例时出现错误
我已经安装了cudatoolkit_3.2.16_win_64和gpucomputingsdk_3.2.16_win_64。当我选择 SDK 的示例时,出现以下错误: 导入的项目“C:\Program Files (x8…
CUDA on Thrust:如何实现优先级队列
我的计划是使用皮尔逊相关性计算距离矩阵,并从距离矩阵中获取每个节点的 q- 最近邻 (q=ln(n)) 并将它们放入结果向量中。我在 C++ 中使用相关函数循环…
在 GPU 上运行的计算任务会对图形性能产生负面影响吗?
我从来没有做过 GPU 编程,但终于买了一张 Nvidia 卡来试验。然而,该卡也驱动我的显示器。我的问题是在卡上运行通用计算任务是否会对图形性能产生负…
带 VDPAU 的 GStreamer(使用 nVidia 卡进行 h264 加速)
我使用最新版本的 gstreamer 插件很糟糕,我想尝试 VDPAU。 我用搅拌机基金会的大兔子电影进行了测试。 我尝试过这个命令: gst-launch-0.10 filesrc=…
新的 Amazon EC2 集群 GPU 实例体验如何?
亚马逊发布了 EC2 - 集群 GPU 实例,我想知道您对此有何体验?它是否稳定,在部署 CUDA 代码之前是否需要大量时间来安装新的驱动程序、SDK 等?…
当编译器未提供 uint8_t 时,什么是更好的替代方案?
我正在使用 nvcc 编译 CUDA 内核。不幸的是,nvcc 似乎不支持 uint8_t,尽管它确实支持 int8_t(!)。出于可移植性、可读性和理智的原因,我宁愿不使…
CUDA 分析(解释 gst/gld 请求)
cudaprof 中曾经有用于全局内存的分析计数器(gst_coherent、gst_incoherent、gld_coherent、gld_incoherent),这些计数器对我来说非常有用且清晰,…
在使用 CUDA 工具包 OpenCL sdk 进行开发时,我可以通过 OpenCL 以 CPU 为目标吗?
我是 GPGPU 概念的新手,在过去的几个月里,我一直在慢慢地了解 CUDA 和 OPENCL 之间的差异。我意识到 OpenCL 规范允许程序员以计算设备为目标(因此…
在 OpenCL 应用程序中嵌入 V8?
我正在使用 OpenCL 编写针对 NVidia CUDA 运行时的 GPGPU 内核。我最近在阅读 V8 并发现了描述 V8 嵌入技术的页面: http://code .google.com/apis/v8…