cuda

cuda

文章 23 浏览 76

cuda 视觉分析器中的 CPU 和 GPU 计时器

所以cuda Visual Profiler中有2个定时器, GPU Time:它是GPU上方法的执行时间。 CPU时间:它是启动该方法的GPU时间和CPU开销的总和。在驱动程序生成…

少女的英雄梦 2024-10-06 14:31:16 1 0

如何在 CUDA Fortran 中分配共享内存数组?

我在尝试在内核中声明共享内存数组时遇到问题。这是包含我的内核的代码: module my_kernels use cudafor implicit none contains attributes(global)…

忆梦 2024-10-06 13:29:08 0 0

CUDA 确定每个块的线程、每个网格的块

我是 CUDA 范例的新手。我的问题是确定每个块的线程数和每个网格的块数。这是否需要一些艺术和尝试?我发现许多例子似乎为这些事情选择了任意的数字。…

仅此而已 2024-10-06 12:51:13 1 0

是否可以在多个 GPU 上运行 cuda 内核

这是一个相当简单的问题,但谷歌搜索似乎没有答案,所以。 我想知道的是,如果我有两个能够运行 cuda 的 GPU 卡(相同),我的内核可以跨越这些卡吗?…

情绪少女 2024-10-06 12:34:44 0 0

将 Typename1 的 Cuda Array1 转换为 Typename2 的 Array2

亲爱的 Cuda 学者, 寻找以下问题的解决方案 a)我有两个数组 1) size1 的 array1,其类型为 name1 2) array2 of size1 is of typename2 b) 我想编写…

幽梦紫曦~ 2024-10-06 09:41:20 1 0

Cuda 不同的内存分配

我正在使用 CUDA 开发一个小型应用程序。 我有一个巨大的二维数组(不适合共享内存),其中所有块中的线程都将从随机位置不断读取。 这个二维数组是一…

仙女山的月亮 2024-10-06 08:58:19 0 0

CUDA:编译我的第一个 cuda 程序时出错

我对 CUDA 编程非常陌生。我编写了第一个代码,当我编译它时,它向我显示了很多错误。谁能告诉我 代码 #include &ltstdio.h&gt #include "cuda.h" #in…

牵你的手,一向走下去 2024-10-06 08:08:37 0 0

是否有用于加速矢量计算的 Java 库?

我正在寻找一个Java库,它允许使用向量(也许还​​有矩阵)进行一些快速计算。 我所说的“快速”是指它利用了 GPU 处理和/或 SSE 指令。我想知道是否…

寂寞美少年 2024-10-06 07:47:54 0 0

在 CUDA 中测试无穷大

在 CUDA 程序中,我最近从使用 return x==INFINITY || x==-INFINITY 来自 math.h 的 INFINITY 来测试无穷大,转换为使用来自 math.h 的无穷大测试, r…

我的黑色迷你裙 2024-10-06 07:05:43 0 0

cutil函数编译程序

我正在使用 cutil.h 中的一些函数来计时我的代码。它在 Windows XP 和 vs 2008 上编译得很好。最近,我切换到 Windows 7 和 vs 2008。相同的代码无法…

请叫√我孤独 2024-10-06 03:02:18 0 0

计算 3x3 对称矩阵谱分解的快速方法

我正在开发一个项目,基本上在 20-100 个点的集合上执行 PCA 数百万次。目前,我们正在使用一些遗留代码,这些代码使用 GNU 的 GSL 线性代数包对协方…

罪#恶を代价 2024-10-06 00:52:33 1 0

CUDA:结果总和

我正在使用 CUDA 来运行一个问题,其中我需要一个包含许多输入矩阵的复杂方程。每个矩阵都有一个 ID,具体取决于其集合(1 到 30 之间,有 100,000 个…

悲喜皆因你 2024-10-05 20:04:33 0 0

CUDA CUDPP .so 构建

我想在我的项目中使用 CUDPP 库。我已从项目页面下载了源代码。不幸的是,当我运行“make”时,只有静态库构建。我查看了 Makefile 文件,没有找到任…

自在安然 2024-10-05 05:20:13 0 0

具有 PCI 接口的 GPU 上的 nVidia CUDA

您是否有在使用 PCI 接口(而不是 PCIe)的已启用 GPU 上使用 CUDA 的经验?有效吗?…

一个人练习一个人 2024-10-04 19:57:08 0 0

我们能否对 CUDA 或 OpenCL 与 CPU 性能相比的速度进行基准测试?

与一般的单处理器核心相比,CUDA 或 OpenCL 代码上的算法运行速度能快多少? (考虑到算法是针对 CPU 和 GPU 目标编写和优化的)。 我知道这取决于显…

停顿的约定 2024-10-04 08:58:29 0 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文