第 32 页 - cuda - 文江博客

投稿关注

cuda

文章 23 浏览 77

当奇数/偶数线程在 CUDA 中执行不同操作时优化代码性能

我有两个大向量，我正在尝试进行某种元素乘法，其中第一个向量中的偶数元素乘以第二个向量中的下一个奇数元素......并且其中奇数元素第一个向量中的元…

命硬 2024-09-02 03:32:00 6 0

cmake：CUDA 目标的特定于目标的预处理器定义似乎不起作用

我在 Mac OSX 10.6 上使用 cmake 2.8.1 和 CUDA 3.0。所以我添加了一个 CUDA 目标，它需要将 BLOCK_SIZE 设置为某个数字才能编译。 cuda_add_executa…

世界如花海般美丽 2024-09-01 21:24:01 4 0

当 CUDA 线程处于同一循环中并且我们需要同步它们以仅执行有限的部分时，如何同步它们

我已经编写了一些代码，现在我想在 CUDA GPU 上实现它，但我对同步还不熟悉。下面我展示了代码，我希望 LOOP1 由所有线程执行（因此我希望这部分利用 …

终止放荡 2024-09-01 04:43:37 5 0

CUDA 中的双精度浮点

CUDA支持双精度浮点数吗？另外，同样的原因是什么？…

分分钟 2024-09-01 01:32:41 6 0

GPGPU上的金融应用

我想知道使用 GPGPU 可以实现什么样的金融应用程序。我知道使用 CUDA 在 GPGPU 上使用蒙特卡罗模拟进行期权定价/股票价格估计。有人可以列举一下在金…

送你一个梦 2024-09-01 01:12:49 8 0

Nvidia Tesla 与 480 的 CUDA 编程比较

Closed. This question is off-topic. It is not currently accepting answers. 想要改进此问题吗？更新问题，使其关于- Stack Overflow 的主题。 12…

梓梦 2024-08-31 17:59:07 3 0

这个数组比较问题的最佳算法是什么？

解决以下问题最有效的速度算法是什么？给定 6 个数组，D1、D2、D3、D4、D5 和 D6，每个数组包含 6 个数字，例如： D1[0] = number D2[0] = number ..…

朕就是辣么酷 2024-08-31 06:43:32 3 0

如何将数据传递给 CUDA 中的共享变量？

我有一个传递3个数组的内核，第一个数组d_A1没有数据，仅用于写回数据，其他两个数组d_D1和d_ST1有数据。第一个数组的大小为： d_A1[13000000] 第二…

段念尘 2024-08-31 03:30:58 1 0

尝试“制作” CUDA SDK，ld找不到库，ldconfig说可以

我知道还有很多其他与此类似的问题，但是没有一个解决方案适合我基本上，制作 SDK 示例文件时，我得到 /usr/bin/ld：找不到-lcuda 这将是一个足够简…

温馨耳语 2024-08-30 12:08:02 4 0

OpenCL+NVidia 的专有计算模式

我对 NVidia+OpenCL 的独占计算模式有疑问。我可以在 nvidia-gpu 上使用 nvidia-smi 设置独占计算模式（cuda 编程指南 3.0 第 74 页）。这意味着只有…

摇划花蜜的午后 2024-08-30 11:42:59 5 0

CUDA 设备如何处理立即操作数？

使用立即数（整数）操作数编译 CUDA 代码，它们是保存在指令流中，还是放入内存中？具体来说，我正在考虑 24 位或 32 位无符号整数操作数。到目前为…

灯下孤影 2024-08-30 02:38:24 2 0

CUDA 3.0 和 cmake 以及仿真模式

我正在尝试在我的 Mac (OSX 10.6) 上使用 CUDA 和 cmake (v 2.8)。到目前为止，它运行良好，我创建了一个小样本只是为了尝试一下（见下文）。但是，当…

墨小沫ゞ 2024-08-29 17:44:11 4 0

如何修改作为变量参数列表的一部分传递的指针？

我有一个函数，它需要可变数量的指针，我想对其进行修改。它看起来像： void myPointerModifyingFunction (int num_args, ... ) { void *gpu_pointer …

对你的占有欲 2024-08-29 06:43:45 2 0

CUDA 结果可以存储在 OpenGL 可访问的纹理中吗？

CUDA可以用来生成OpenGL纹理吗？我知道可以通过将 CUDA 结果读回系统内存，然后将其加载到纹理中来完成...但我想找到一种方法来保存此副本...可以使用…

缘字诀 2024-08-29 02:36:33 4 0

如何从 CUDA 内核函数返回单个变量？

我有一个 CUDA 搜索函数，可以计算一个变量。我怎样才能把它退回来。 __global__ void G_SearchByNameID(node* Node, long nodeCount, long start,cha…

紫竹語嫣☆ 2024-08-29 01:03:00 2 0

linfzu01

文章 0 评论 0

关注

§对你不离不弃

文章 0 评论 0

关注

可遇━不可求

文章 0 评论 0

关注

枕梦

文章 0 评论 0

关注

qq_3LFa8Q

文章 0 评论 0

关注

JP

文章 0 评论 0

友情链接

文江博客

cuda

当奇数/偶数线程在 CUDA 中执行不同操作时优化代码性能

cmake：CUDA 目标的特定于目标的预处理器定义似乎不起作用

当 CUDA 线程处于同一循环中并且我们需要同步它们以仅执行有限的部分时，如何同步它们

CUDA 中的双精度浮点

GPGPU上的金融应用

Nvidia Tesla 与 480 的 CUDA 编程比较

这个数组比较问题的最佳算法是什么？

如何将数据传递给 CUDA 中的共享变量？

尝试“制作” CUDA SDK，ld找不到库，ldconfig说可以

OpenCL+NVidia 的专有计算模式

CUDA 设备如何处理立即操作数？

CUDA 3.0 和 cmake 以及仿真模式

如何修改作为变量参数列表的一部分传递的指针？

CUDA 结果可以存储在 OpenGL 可访问的纹理中吗？

如何从 CUDA 内核函数返回单个变量？

热门标签

推荐作者

linfzu01

§对你不离不弃

可遇━不可求

枕梦

qq_3LFa8Q

JP

友情链接