用于 MD5 加密的 Nvidia CUDA 或 ATI Stream?
当我看到一些我不知道的有关 ATI 的统计数据时,我正准备购买 Nvidia GTX 470。 ATI 卡上的流是否能更好地执行加密和解密所需的数学运算?…
从常规 C++ 调用 CUDA 代码代码 - 整理出外部“C”
我试图从单独编译的 C++ 文件调用 CUDA(主机)函数: sample.cpp C++ 文件: extern "C" void cuda_function(int a, int b) int main(){ //statement…
如何在 Linux 中读取 CUDA .cubin 二进制文件?
我正在尝试获取 CUDA 程序中每个内核的每个线程的寄存器数量。这将帮助我使用 CUDA 占用计算器 (http://developer.download.nvidia.com/compute/cuda/…
OpenCL/CUDA 中每种内存访问类型有多少内存延迟周期?
我浏览了编程指南和最佳实践指南,其中提到全局内存访问需要 400-600 个周期。我没有看到太多其他内存类型,如纹理缓存、常量缓存、共享内存。寄存器…
请推荐一款用于GPU编程的显卡
Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 这个问题似乎不是关于特定的编程问题、…
大型矩阵的 CUDA 矩阵乘法中断
我有以下矩阵乘法代码,使用 CUDA 3.2 和 VS 2008 实现。我在 Windows Server 2008 r2 enterprise 上运行。我正在运行 Nvidia GTX 480。以下代码可以…
有没有办法记录 cuda 的“.cu”文件使用 doxygen
由于cuda的“.cu”文件基本上是c,有没有办法我们可以使用doxygen为“.cu”文件生成文档?我注意到 NVIDIA 使用 doxygen 来生成 cuda 的文档。但是,…
如何以程序员愉快的方式使用 CUDA 常量内存?
我正在使用 CUDA 框架开发一个数字处理应用程序。我有一些应该可供所有线程访问的静态数据,因此我将其放入常量内存中,如下所示: __device__ __cons…
如何使用 CUDA 在一个 GPU 上运行 1 个以上内核?
kernel1 <<< blocks1, threads1, 0, stream1 >>> ( args ... ) ... kernel2 <<< blocks2, threads2, 0, stream2 >>> ( args …
CUDA 3.2 中的仿真模式与 VS2008
我正在尝试使用设备模拟模式调试内核代码。 但是,我在内核中设置了断点,但它没有中断。 MatrixMultiplication_Kernel<<<dimGrid, dimBlock>…
两个几乎相同的调用,一个有效,一个失败
我有这些模板函数,可以在带有 cuda 的设备上内联使用, template <class T> __device__ inline T& cmin(T&a,T&b){return (a<b)?(a):(…