cuda

cuda

文章 23 浏览 78

对 2D 数组使用纹理缓存/Image2D 的缺点?

当访问全局内存中的 2D 数组时,使用纹​​理缓存有很多好处,例如过滤并且不必太关心内存访问模式。 CUDA 编程指南仅指出了一个缺点: 但是,在同一…

只为一人 2024-12-02 04:57:48 2 0

浮点数舍入问题

我在 CUDA 中完成了论文,但我遇到了最后一个问题,这与舍入浮点数有关。 我有一个名为 bin 的整数变量,它是 x+y*X_dim 的编码。给定 bin,我想找到…

ζ澈沫 2024-12-02 03:56:52 4 0

编译cuda代码时遇到问题

我想编译这个体积渲染项目。我在 Ubuntu 10.10 计算机上安装了 CUDA 工具包和 SDK,并且能够运行其示例,但我得到了这个: antonio@antonio-desktop:~…

╰つ倒转 2024-12-02 03:10:47 0 0

可以用整数索引 CUDA 纹理吗

正如题目所说。可以使用整数坐标访问 CUDA 纹理吗? 前任。 tex2D(myTex, 1, 1); 我想在纹理中存储浮点值,并将其用作我的帧缓冲区。 我会将其传递给 …

停滞 2024-12-02 03:01:13 1 0

Visual Studio 2010 CUDA 4.0 链接器错误

有谁知道一种简单的方法来修复以下错误: 1>matrixmul.cu.obj : error LNK2019: unresolved external symbol __imp_cutComparefe referenced in funct…

长伴 2024-12-01 20:59:39 1 0

CUDA中本地内存比共享内存慢吗?

我只发现一个评论,本地内存比寄存器内存(每线程两个类型)慢。 共享内存应该很快,但是它比[线程的]本地内存快吗? 我想做的是一种中值过滤器,但使…

情未る 2024-12-01 20:03:40 2 0

CUDA 内核函数比同等主机函数花费更长的时间

我正在关注 http://code.google.com/p/stanford- cs193g-sp2010/ 和在线发布的视频讲座,在做其中一个发布的问题集(第一个)时,我遇到了一些稍微违…

翻了热茶 2024-12-01 17:48:56 0 0

删除排序列表中的条目:在 GPU 中有效

我正在尝试在 cuda/thrust 中编写以下问题的代码。我得到了一个键列表以及与每个键关联的三个值。我已经设法按字典顺序对它们进行排序。如果具有相同…

私藏温柔 2024-12-01 11:55:14 1 0

指针到指针的语法问题

可以说我有以下内容: void init_gpu(cuComplex* d_hhBuff) { cutilSafeCall(cudaMalloc((void **)&d_hhBuff, memsize)); } 我用类似的方式调用它 cuC…

放我走吧 2024-12-01 05:46:20 0 0

在 CUDA 程序中添加函数

所以,我想我有一个非常奇怪的问题。 因此,假设我已经在 GPU 上放置了一个程序,并且在该程序中我调用了函数 X。但是该函数 X 尚未声明。 我希望能够…

恏ㄋ傷疤忘ㄋ疼 2024-12-01 05:43:49 3 0

为什么在 CUDA 中用位运算替换 if-else 会变慢?

我 if((nMark >> tempOffset) & 1){nDuplicate++;} else{nMark = (nMark | (1 << tempOffset));} 用 nDuplicate += ((nMark >> tempOffset) & 1); nMa…

翻身的咸鱼 2024-12-01 04:44:37 2 0

关于CUDA中从block到SM的分配细节的问题

我以计算能力1.3的硬件为例。 30 个 SM 可用。那么最多可以同时运行240个块(考虑到寄存器和共享内存的限制,对块数量的限制可能要低得多)。超过 240…

逐鹿 2024-12-01 04:05:50 1 0

CUDA 内核代码的设备内存:是否可以显式管理?

语境: CUDA 4.0、Linux 64 位、NVIDIA UNIX x86_64 内核模块 270.41.19、GeForce GTX 480。 我尝试在程序中查找(设备)内存泄漏。我使用运行时 API …

苍暮颜 2024-12-01 04:04:18 0 0

用于多个 GPU 的 cudaDeviceReset

我目前正在开发一个具有 4 个 Tesla T10 GPU 的 GPU 服务器。当我不断测试内核并且必须经常使用 ctrl-C 终止进程时,我在简单的设备查询代码的末尾添…

沉溺在你眼里的海 2024-11-30 21:10:25 0 0

如何确定CUDA的哪些行使用最多的寄存器?

我有一个有点复杂的内核,具有以下统计数据: ptxas info : Compiling entry function 'my_kernel' for 'sm_21' ptxas info : Function properties fo…

一曲琵琶半遮面シ 2024-11-30 18:08:11 0 0
更多

推荐作者

Gabu-gabumon

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

荔枝明

文章 0 评论 0

¤→小豸慧

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文