第 5 页 - cuda - 文江博客

投稿关注

cuda

文章 23 浏览 78

CUDA：将结构指针传递给设备函数可以吗？

在内核内部，可以将内核内部声明的结构体地址传递给设备函数吗？设备函数的参数是一个指向结构的指针。…

陈独秀 2024-12-06 03:25:15 0 0

为什么 256 或 512 的 CUDA 块大小比其他块大小能提供更好的性能？

我在 Windows 7 上用 CUDA C 编写了一些程序。我对块大小进行了实验。我发现在大多数情况下，256 或 512 的块大小比其他块大小提供更好的性能。谁能告…

天气好吗我好吗 2024-12-06 02:59:44 0 0

YDL.net 的 Eclipse CUDA 插件是否已准备好支持 CUDA 4.0

我刚刚安装了 CUDA 4.0 Toolkit，以及用于 Eclipse Helios 的 CUDA 插件 AMD64 Ubuntu 10.10 机器。我已经能够成功编译所有 NVIDIA GPU 计算 SDK 示例…

叹沉浮 2024-12-05 19:02:37 0 0

函数内的推力计数迭代器

非常感谢您在 Cuda Thrust Custom function 的答案，如果我想通过的话，最后一件事另一个向量来复制这样的值？ for (i=0;i

贪了杯 2024-12-05 17:22:10 0 0

如何评估 CUDA GPU 的相对性能？

我怎样才能估计我不拥有的卡的cuda性能，即。新卡？例如，我发现了一个不完整的 Cuda 示例，作者写道，他在 GF 8600 GT 上花费了 0.7 秒。但在我的 Q…

扬花落满肩 2024-12-05 16:07:31 1 0

cuda sdk 示例带宽测试 - 构建失败

我正在尝试从cuda sdk构建bandwidthTest_vs2010，但出现错误：1>LINK：致命错误LNK1104：无法打开文件'shrUtils32D.lib' 其他库目录包含： $(CudaTool…

神经大条 2024-12-05 14:35:46 0 0

GPU 的哈希表实现

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

亚希 2024-12-05 11:52:56 1 0

global 函数中的动态内存分配

我有一张 CC 1.1 卡，我的程序需要我在全局或设备函数中动态分配数组。将为每个执行线程创建这些数组。 malloc 抛出错误，网上冲浪告诉我，对于小于 …

流星番茄 2024-12-05 09:47:48 1 0

Cuda 更改数组中的单个值

我在 CUDA 设备内存中计算了一个名为 d_index 的向量，我只想更改一个值，如下所示... d_index[columnsA-rowsA]=columnsA; 我怎样才能做到这一点，而…

枯寂 2024-12-05 08:40:21 0 0

Cuda Thrust 自定义函数

如何在 Thrust 中实现这个功能？ for (i=0;i

天荒地未老 2024-12-05 06:21:04 1 0

CUDA、浮点精度

我在 Geforce GTX 580 (Fermi) 上使用 CUDA 4.0。我的数字小到 7.721155e-43 。我想将它们相乘一次或者更好地说我想计算 7.721155e-43 * 7.721155e-43…

等风来 2024-12-05 03:38:46 2 0

使用 nvcc 在 CUDA 中编译模板函数时出错

我有以下 CUDA 代码： enum METHOD_E { METH_0 = 0, METH_1 }; template inline __device__ int test_func() { return int(METH); } __global__ void …

送你一个梦 2024-12-05 00:19:49 3 0

CUDPP 排序比 THRUST 快？那么结构体数组呢？

我有一个结构数组，我想对它们进行排序。我一直在使用 Thrust::sort 并且效果很好。然后人们告诉我 CUDPP 的排序速度更快，但我发现不可能直接对结构…

于我来说 2024-12-04 20:58:24 1 0

CUDA“未指定的启动失败”访问内存

我想做的事情很简单。每个线程从存储在全局内存中的全局数组中读取子数组。然后它进行一些计算并将结果存储在静态数组中。最后输出被存储回全局内…

爱你不解释 2024-12-04 19:29:59 0 0

添加 CUDA dll 作为对显示错误的 C# 项目的引用

我已经制作了一个简单的 CUDA dll，代码如下所示。该函数向数组添加一些值。 #include #include #include //Cuda Kernel __global__ void add_gpu(flo…

橘和柠 2024-12-04 19:15:38 0 0

共 58 页
上一页
3
4
5
6
7
下一页

关注

友情链接

文江博客

cuda

CUDA：将结构指针传递给设备函数可以吗？

为什么 256 或 512 的 CUDA 块大小比其他块大小能提供更好的性能？

YDL.net 的 Eclipse CUDA 插件是否已准备好支持 CUDA 4.0

函数内的推力计数迭代器

如何评估 CUDA GPU 的相对性能？

cuda sdk 示例带宽测试 - 构建失败

GPU 的哈希表实现

global 函数中的动态内存分配

Cuda 更改数组中的单个值

Cuda Thrust 自定义函数

CUDA、浮点精度

使用 nvcc 在 CUDA 中编译模板函数时出错

CUDPP 排序比 THRUST 快？那么结构体数组呢？

CUDA“未指定的启动失败”访问内存

添加 CUDA dll 作为对显示错误的 C# 项目的引用

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接