cuda

cuda

文章 23 浏览 78

CUDA:将结构指针传递给设备函数可以吗?

在内核内部,可以将内核内部声明的结构体地址传递给设备函数吗?设备函数的参数是一个指向结构的指针。…

陈独秀 2024-12-06 03:25:15 0 0

为什么 256 或 512 的 CUDA 块大小比其他块大小能提供更好的性能?

我在 Windows 7 上用 CUDA C 编写了一些程序。我对块大小进行了实验。我发现在大多数情况下,256 或 512 的块大小比其他块大小提供更好的性能。谁能告…

天气好吗我好吗 2024-12-06 02:59:44 0 0

YDL.net 的 Eclipse CUDA 插件是否已准备好支持 CUDA 4.0

我刚刚安装了 CUDA 4.0 Toolkit,以及用于 Eclipse Helios 的 CUDA 插件 AMD64 Ubuntu 10.10 机器。我已经能够成功编译所有 NVIDIA GPU 计算 SDK 示例…

叹沉浮 2024-12-05 19:02:37 0 0

函数内的推力计数迭代器

非常感谢您在 Cuda Thrust Custom function 的答案, 如果我想通过的话,最后一件事另一个向量来复制这样的值? for (i=0;i

贪了杯 2024-12-05 17:22:10 0 0

如何评估 CUDA GPU 的相对性能?

我怎样才能估计我不拥有的卡的cuda性能,即。新卡? 例如,我发现了一个不完整的 Cuda 示例,作者写道,他在 GF 8600 GT 上花费了 0.7 秒。但在我的 Q…

扬花落满肩 2024-12-05 16:07:31 1 0

cuda sdk 示例带宽测试 - 构建失败

我正在尝试从cuda sdk构建bandwidthTest_vs2010,但出现错误:1>LINK:致命错误LNK1104:无法打开文件'shrUtils32D.lib' 其他库目录包含: $(CudaTool…

神经大条 2024-12-05 14:35:46 0 0

GPU 的哈希表实现

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

亚希 2024-12-05 11:52:56 1 0

__global__ 函数中的动态内存分配

我有一张 CC 1.1 卡,我的程序需要我在全局或设备函数中动态分配数组。 将为每个执行线程创建这些数组。 malloc 抛出错误,网上冲浪告诉我,对于小于 …

流星番茄 2024-12-05 09:47:48 1 0

Cuda 更改数组中的单个值

我在 CUDA 设备内存中计算了一个名为 d_index 的向量,我只想更改一个值,如下所示... d_index[columnsA-rowsA]=columnsA; 我怎样才能做到这一点,而…

枯寂 2024-12-05 08:40:21 0 0

Cuda Thrust 自定义函数

如何在 Thrust 中实现这个功能? for (i=0;i

天荒地未老 2024-12-05 06:21:04 1 0

CUDA、浮点精度

我在 Geforce GTX 580 (Fermi) 上使用 CUDA 4.0。我的数字小到 7.721155e-43 。我想将它们相乘一次或者更好地说我想计算 7.721155e-43 * 7.721155e-43…

等风来 2024-12-05 03:38:46 2 0

使用 nvcc 在 CUDA 中编译模板函数时出错

我有以下 CUDA 代码: enum METHOD_E { METH_0 = 0, METH_1 }; template inline __device__ int test_func() { return int(METH); } __global__ void …

送你一个梦 2024-12-05 00:19:49 3 0

CUDPP 排序比 THRUST 快?那么结构体数组呢?

我有一个结构数组,我想对它们进行排序。我一直在使用 Thrust::sort 并且效果很好。然后人们告诉我 CUDPP 的排序速度更快,但我发现不可能直接对结构…

于我来说 2024-12-04 20:58:24 1 0

CUDA“未指定的启动失败”访问内存

我想做的事情很简单。 每个线程从存储在全局内存中的全局数组中读取子数组。 然后它进行一些计算并将结果存储在静态数组中。 最后输出被存储回全局内…

爱你不解释 2024-12-04 19:29:59 0 0

添加 CUDA dll 作为对显示错误的 C# 项目的引用

我已经制作了一个简单的 CUDA dll,代码如下所示。该函数向数组添加一些值。 #include #include #include //Cuda Kernel __global__ void add_gpu(flo…

橘和柠 2024-12-04 19:15:38 0 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文