cuda

cuda

文章 23 浏览 78

CUDA 内核代码的设备内存:是否可以显式管理?

语境: CUDA 4.0、Linux 64 位、NVIDIA UNIX x86_64 内核模块 270.41.19、GeForce GTX 480。 我尝试在程序中查找(设备)内存泄漏。我使用运行时 API …

苍暮颜 2024-12-01 04:04:18 1 0

用于多个 GPU 的 cudaDeviceReset

我目前正在开发一个具有 4 个 Tesla T10 GPU 的 GPU 服务器。当我不断测试内核并且必须经常使用 ctrl-C 终止进程时,我在简单的设备查询代码的末尾添…

沉溺在你眼里的海 2024-11-30 21:10:25 0 0

如何确定CUDA的哪些行使用最多的寄存器?

我有一个有点复杂的内核,具有以下统计数据: ptxas info : Compiling entry function 'my_kernel' for 'sm_21' ptxas info : Function properties fo…

一曲琵琶半遮面シ 2024-11-30 18:08:11 1 0

是否有方法能够阻止某些块直到满足某些条件?

我想阻止一些块,直到一个变量被设置为特定值。所以我编写这段代码来测试一个简单的 do-while 循环是否有效。 __device__ int tag = 0; __global__ vo…

來不及說愛妳 2024-11-30 11:17:09 0 0

cuda算法结构

我想了解使用 CUDA 在 GPU 上执行以下操作的一般方法。 我有一个可能看起来像这样的算法: void DoStuff(int[,] inputMatrix, int[,] outputMatrix) {…

極樂鬼 2024-11-30 09:05:51 2 0

Cuda 4.0 与 Visual Studio 2010 cl 编译器错误

因为我在 Nvidia 论坛 中没有得到任何帮助(请参阅我的帖子位于线程底部),看来我并不是唯一一个在类似问题上挣扎的人遇到问题,我就在这里尝试一下…

烟柳画桥 2024-11-30 07:54:33 2 0

为什么“a=(b>0)?1:0”比“if-else”更好CUDA版本?

你能告诉我为什么 a =(b>0)?1:0 更好吗 if (b>0)a=1; else a =0; 比CUDA 中的版本 ?请提供详细信息。非常感谢。 易…

兮子 2024-11-30 02:35:58 0 0

如何在main()之外调用CUDA函数?

我对 CUDA 编程非常陌生,而且设置起来并不困难。我正在使用驱动程序 API,我修改了编译工作流程,并且我所有的学习内核和主机程序都运行良好。我直接…

要走干脆点 2024-11-29 22:48:53 1 0

CUDA 凸包程序在大输入时崩溃

我正在尝试在 CUDA 中并行实现 QuickHull 算法(对于凸包)。当 input_size <= 100 万时它可以正常工作。当我尝试 1000 万点时,程序崩溃了。我的显卡…

鱼窥荷 2024-11-29 22:32:31 1 0

双调排序网络与 Thrust::sort_by_key

我实现了一种使用排序的算法。我尝试了 Thrust::sort_by_key ,它花费了大约 0.4 秒的时间对包含 10^7 个元素的数组进行排序。 我认为双调排序网络应…

¢好甜 2024-11-29 20:47:34 1 0

错误:asm 操作数类型大小 (1) 与约束“r”隐含的类型/大小不匹配。关于 Duane Merrill 的 GPU 基数排序

当我尝试在win-XP + VS2005下编译Merrill的基数排序时出现错误。 错误:asm 操作数类型大小(1) 与约束“r”隐含的类型/大小不匹配。 它出现在以下代码…

故事与诗 2024-11-29 18:20:20 1 0

多重定义的标准分配器

我正在尝试使用 VC++2008 编译 C++ DLL。我已经使用 VC++2010 正确编译了它,但使用 VC++2008 时,出现以下错误: 1>msvcprt.lib(MSVCP90.dll) : erro…

浅听莫相离 2024-11-29 14:02:18 0 0

Matlab是否会因CUcontext缓存而导致Cuda内存泄漏?

计算后使用 cudaDeviceReset() 是从 Matlab 使用 GPU 的正常方法吗?我无法在最新版本的 Matlab 中使用 GPU 计算,因为我的 GPU 不支持 Compute Capab…

通知家属抬走 2024-11-29 13:11:27 2 0

CUDA程序抛出内存泄漏错误

我不明白为什么下面的简单代码在 c[0] = d 处失败 void test(char **a){ char **c; cudaMemcpy(c,a, sizeof(char*), cudaMemcpyDeviceToHost); char t…

北笙凉宸 2024-11-29 12:49:02 1 0

CUDA程序赋予垃圾价值

我真的不明白为什么下面代码的输出不是a和b。 #include #include __global__ void p(unsigned char **a){ unsigned char temp[2]; temp[0] = 'a'; tem…

空气里的味道 2024-11-29 12:28:17 0 0
更多

推荐作者

Gabu-gabumon

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

荔枝明

文章 0 评论 0

¤→小豸慧

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文