cuda

cuda

文章 23 浏览 78

3D 数组表示 CUDA

我有一个 3D 图像。我需要使用指针将该图像复制到 cuda 的全局内存中。 目前我正在执行以下操作。在以下实现中,数组是线性一维数组。 float *image =…

无畏 2024-12-03 05:32:28 1 0

用short替换int对CUDA的性能有帮助吗

假设我们有足够的全局内存。用 short 替换 int 是否可以提高 CUDA 的性能? (如short节省了共享内存、寄存器等的使用) 欢迎建议。谢谢。…

咋地 2024-12-03 01:54:13 1 0

编译 helloworld.cu 时遇到问题

在 Ubuntu 10.10 中编译这个 hello world 示例时, 这来自 CUDA 示例,章节3(没有提供编译指令>:@) #include __global__ void kernel (void){ } in…

优雅的叶子 2024-12-02 22:13:36 0 0

3D 图像索引

我有一张尺寸为 512 x 512 x 512 的图像。 我需要单独处理所有体素。 我怎样才能获得线程ID来做到这一点? 如果我使用 1D 线程 ID,块数将超过 65536…

可可 2024-12-02 21:53:07 0 0

WPF 应用程序中的 CUDA 和 Direct3D 互操作性

我尝试使用CUDA计算和Direct3D 9图形来实现WPF应用程序。所以我使用以下方法: 我使用 MSDN“演练:托管 Direct3D9”创建 WPF 应用程序 WPF 中的内容…

你的背包 2024-12-02 16:10:17 2 0

CUDA 中 exp() expf() 和 __expf() 之间的区别

如何优化CUDA中的exp函数? CUDA 中以下各项有什么区别? exp() expf() __expf() …

夏夜暖风 2024-12-02 10:22:52 0 0

cuda nbody模拟-共享内存问题

基于 Nvidia GPU 计算 SDK 的示例,我为 nbody 模拟创建了两个内核。第一个不利用共享内存的内核比第二个使用共享内存的内核快约 15%。为什么共享内存…

清醇 2024-12-02 10:16:39 2 0

如何告诉 NVCC 生成 x64 obj?

我在使用 VS 2006 CUDA 4.0 x64 编译为 x64 时遇到问题。 NVCC 编译器生成 32 位 obj 文件,然后 MS 链接器抱怨该 obj 文件不是针对 x64 的。有没有办…

椒妓 2024-12-02 08:28:55 1 0

cuda头文件

我有一个名为“KernelUtil.cu”的文件,如下所示 __device__ int add(int a, int b) { return a+b; } 我的主程序是“main.cu”。我需要从这里调用“ad…

清浅ˋ旧时光 2024-12-02 05:50:16 1 0

对 2D 数组使用纹理缓存/Image2D 的缺点?

当访问全局内存中的 2D 数组时,使用纹​​理缓存有很多好处,例如过滤并且不必太关心内存访问模式。 CUDA 编程指南仅指出了一个缺点: 但是,在同一…

只为一人 2024-12-02 04:57:48 2 0

浮点数舍入问题

我在 CUDA 中完成了论文,但我遇到了最后一个问题,这与舍入浮点数有关。 我有一个名为 bin 的整数变量,它是 x+y*X_dim 的编码。给定 bin,我想找到…

ζ澈沫 2024-12-02 03:56:52 3 0

编译cuda代码时遇到问题

我想编译这个体积渲染项目。我在 Ubuntu 10.10 计算机上安装了 CUDA 工具包和 SDK,并且能够运行其示例,但我得到了这个: antonio@antonio-desktop:~…

╰つ倒转 2024-12-02 03:10:47 0 0

可以用整数索引 CUDA 纹理吗

正如题目所说。可以使用整数坐标访问 CUDA 纹理吗? 前任。 tex2D(myTex, 1, 1); 我想在纹理中存储浮点值,并将其用作我的帧缓冲区。 我会将其传递给 …

停滞 2024-12-02 03:01:13 1 0

Visual Studio 2010 CUDA 4.0 链接器错误

有谁知道一种简单的方法来修复以下错误: 1>matrixmul.cu.obj : error LNK2019: unresolved external symbol __imp_cutComparefe referenced in funct…

长伴 2024-12-01 20:59:39 1 0

CUDA中本地内存比共享内存慢吗?

我只发现一个评论,本地内存比寄存器内存(每线程两个类型)慢。 共享内存应该很快,但是它比[线程的]本地内存快吗? 我想做的是一种中值过滤器,但使…

情未る 2024-12-01 20:03:40 1 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文