cuda

cuda

文章 23 浏览 76

如何动态创建方法来操作在运行时初始化的类对象

我有一个类,比如说 class AddElement{ int a,b,c } 用方法来设置/获取 a,b,c... 我的问题绝对是一个逻辑问题 - 假设我实现 AddElement 如下: int Va…

夏末的微笑 2024-09-29 07:55:38 2 0

学习 CUDA 的最佳方法是什么?

我有一些C/C++编程知识,想学习CUDA。我也在Mac上。那么学习 CUDA 的最佳方法是什么?…

剩余の解释 2024-09-29 07:01:27 1 0

如何使用 Visual Studio 2008 调试 CUDA 内核代码?

嘿, 我正在使用带有 CUDA 3.2 的 Visual Studio 2008。我正在尝试调试具有此签名的函数: MatrixMultiplication_Kernel&lt&lt&ltdimGrid, dimBlock&g…

清风挽心 2024-09-29 02:38:42 4 0

CUDA:使用 -deviceemu 和 gdb 进行调试

我编写了一个 CUDA 应用程序,其中包含一些硬编码参数(通过#define)。一切似乎都正常,所以我尝试了一些其他参数。现在,该程序不再正常工作。 所以…

梦与时光遇 2024-09-28 21:24:35 1 0

如何创建 CUDA makefile 以便在 CPU 中执行以测试 CPU FLOP?

我正在尝试计算 GPU 和 CPU FLOPs,并且我从 此处 我将其重命名为 cudaflops.cu 并使用此 makefile 对其进行编译 ##################################…

书间行客 2024-09-28 19:11:50 2 0

GPGPU矩阵加法问题

我有巨大的矩阵,我希望矩阵的输出与输入矩阵的大小相同,只是每个单元格从相邻单元格获取数字之和。 您能指导我如何使用 CUDA 在 GPGPU 平台上实现它…

北音执念 2024-09-28 12:07:49 1 0

固定内存OpenCL,有人成功使用过吗?

我在 clCreateBuffer 调用中使用了 CL_MEM_ALLOC_HOST_PTR 标志,但计算探查器将我的所有“主机内存传输类型”显示为可分页。我在两种不同的内核设置…

迟月 2024-09-28 11:01:08 2 0

CUDA 内核在 2 个不同的 GPU 上抛出不同的结果(GeForce 8600M GT 与 Quadro FX 770M)

我一直在开发 AES CUDA 应用程序,并且有一个在 GPU 上执行 ECB 加密的内核。为了确保并行运行时算法的逻辑不会被修改,我发送 NIST 提供的已知输入测…

梦初启 2024-09-28 10:36:10 2 0

使用 CUDA 创建链表

是否可以使用 CUDA 在 GPU 上创建链表? 我正在尝试这样做,但遇到了一些困难。 如果我无法在 CUDA 内核中分配动态内存,那么如何创建新节点并将其添…

无法回应 2024-09-28 09:43:30 1 0

使用 Visual Studio 2010 编译 CUDA

我之前曾使用 Visual Studio 2008 来编译和运行 CUDA 应用程序。我已切换到 Visual Studio 2010 和 Windows 7。我整个上午都在尝试设置集成,但尚未完…

仅冇旳回忆 2024-09-28 09:11:16 0 0

关于计算视觉分析器和用于分析的块数

在《Compute Visual Profiler 用户指南》第 51 页上,它指出: 请注意,如果数字 内核中的块小于或不是多处理器数量的倍数 多次运行的计数器值将不一…

在巴黎塔顶看东京樱花 2024-09-28 03:47:57 0 0

cuda内核中的函数

有什么方法可以在 cuda 内核中拥有一个函数吗?我的意思是我的 cuda 内核变得相当长并且在某一时刻很难调试。谢谢。…

拒绝两难 2024-09-28 01:45:23 1 0

CUDA 计数、减少和线程扭曲

我正在尝试创建一个 cuda 程序,通过缩减算法来计算长向量中的真值(由非零值定义)的数量。我得到了有趣的结果。我得到 0 或 (ceil(N/threadsPerBloc…

谁的新欢旧爱 2024-09-28 01:45:08 1 0

是否可以在 Compute Prof (OpenCL/CUDA) 中同时比较两个以上内核的执行情况

是否可以在 Compute Prof 中同时比较两个以上的内核执行情况?…

格子衫的從容 2024-09-28 01:26:22 1 0

CUDA 线程分配

我已经阅读了 CUDA 编程指南,但无法理解如下所示的线程分配方法: dim3 dimGrid( 2, 2, 1 ) dim3 dimBlock( 4, 2, 2 ) KernelFunction&lt&lt&lt dimG…

冰葑 2024-09-27 23:33:21 3 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文