cuda

cuda

文章 23 浏览 77

使用 GPU 的 CUDA 同时启动多个内核

是否可以同时启动两个执行独立任务的内核。例如,如果我有这个 Cuda 代码, // host and device initialization ....... ....... // launch kernel1 m…

日久见人心 2024-09-05 08:04:15 5 0

我的内核仅在块 (0,0) 中工作

我正在尝试编写一个简单的矩阵乘法应用程序,使用 CUDA 将两个方阵相乘。我遇到一个问题,我的内核只能在网格的块 (0,0) 中正确计算。 这是我的调用代…

伤痕我心 2024-09-05 04:13:09 0 0

如何在未安装 VS2008 的情况下为 VS2010 安装 Nvidia Parallel NSight (Nexus)?

有没有办法在不安装 VS2008 SP1 的情况下安装 Parallel NSight 并将其与 Visual Studio 2010 一起使用? 安装程序会检查 VS2008 是否已安装,如果没有…

青瓷清茶倾城歌 2024-09-04 21:11:23 2 0

如何制作 CUDA 直方图内核?

我正在为图片上的直方图编写一个 CUDA 内核,但我不知道如何从内核返回一个数组,并且当其他线程读取它时该数组会发生变化。有什么可能的解决方案吗?…

有木有妳兜一样 2024-09-04 18:11:28 2 0

CUDA:注入我自己的PTX函数?

我希望能够使用 PTX 1.3 中尚未在 C 接口上实现的功能。有没有办法在 PTX 中编写我自己的函数并注入到现有的二进制文件中? 我正在寻找的功能是获取 %…

谈下烟灰 2024-09-04 09:05:15 4 0

CUDA 链接错误 - Visual Express 2008 - 由于(空)配置文件导致 nvcc 致命

在过去的两周里,我一直在广泛寻找可能的解决方案来解决我的错误。我已经成功安装了Cuda 64位编译器(工具)和SDK以及64位版本的Visual Studio Expres…

自由如风 2024-09-04 07:29:37 6 0

将项目移植到 OpenGL3

我正在开发一个 C++ 跨平台 OpenGL 应用程序(Windows、Linux 和 MacOS),我想知道你们中的一些人是否可以分享一些关于将大型应用程序移植到 OpenGL …

雪花飘飘的天空 2024-09-04 06:05:48 4 0

CudaMalloc 如何工作?

我正在尝试修改 CUDA SDK 中的 imageDenosing 类,我需要多次重复过滤器,以防捕获时间。但我的代码无法正常工作。 //start __global__ void F1D(TCol…

花开雨落又逢春i 2024-09-04 05:24:35 1 0

不同 CUDA SDK 之间的性能差异?

如果我想重新编写我的应用程序,以便利用 nVidia 的 CUDA SDK 的强大功能,不同 SDK 产品(C++、Java、Python)之间的运行时性能是否有任何差异? 除…

倾其所爱 2024-09-04 03:54:10 5 0

CudaMalloc 如何工作?

我正在尝试修改 CUDA SDK 中的 imageDenosing 类,我需要多次重复过滤器,以防捕获时间。但我的代码无法正常工作。 //start __global__ void F1D(TCol…

昇り龍 2024-09-03 15:42:26 3 0

我可以仅使用 Python 来编程 Nvidia 的 CUDA 还是必须学习 C?

我想这个问题本身就说明了问题。我有兴趣做一些严肃的计算,但我并不是一名程序员。我可以将足够多的Python串在一起来完成我想要的事情。但是我可以用…

飘过的浮云 2024-09-03 15:14:46 6 0

CUDA 可以帮助解决什么样的数据处理问题?

我研究过许多数据匹配问题,通常它们都归结为快速并行运行许多 CPU 密集型算法的实现,例如汉明/编辑距离。这是 CUDA 有用的事情吗? 您用它解决了哪…

木槿暧夏七纪年 2024-09-03 08:40:17 5 0

我可以在 cuda GPU 上的一个块中安装多少个处理器?

我有三个问题要问 如果我在 cuda 中只创建一个线程块并在其上执行并行程序,那么是否有可能将多个处理器分配给单个块,以便我的程序获得多处理器平台…

鱼窥荷 2024-09-02 13:22:22 4 0

使用 CUDA 优化向量元素交换

因为我是cuda新手..我需要你的帮助 我有这个长向量,对于每组 24 个元素,我需要执行以下操作: 对于前 12 个元素,偶数元素乘以 -1, 对于第二个 12 …

记忆消瘦 2024-09-02 05:33:53 4 0

CUDA SDK编译错误

我正在设置 CUDA 工作站。 平台规格: 英特尔酷睿 2 双核, 英伟达 GTX 280, 费多拉 10, GCC 版本 4.3.2 我已经安装了开发人员驱动程序、工具包和 S…

绿萝 2024-09-02 05:03:22 6 0
更多

推荐作者

linfzu01

文章 0 评论 0

可遇━不可求

文章 0 评论 0

枕梦

文章 0 评论 0

qq_3LFa8Q

文章 0 评论 0

JP

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文