cuda

cuda

文章 23 浏览 76

将结构传递给 CUDA 内核

我是 CUDA C 的新手,正在尝试将 typedef 结构传递到内核中。当我尝试使用仅包含整数的结构时,我的方法工作得很好,但是当我切换到浮点数时,我得到…

盗琴音 2024-10-02 04:19:58 0 0

大型跨平台软件项目的技巧/资源

我将开始一个大型软件项目,涉及跨平台 GUI 和大量的数字运算。我计划用 C++ 和 CUDA 编写大部分应用程序后端,并用 Qt4 编写 GUI。我计划使用 Make …

荆棘i 2024-10-01 23:10:48 1 0

通过引用传递 CUDA 随机生成器状态

在函数CalculateValue(curandState *localStat)和GetExponential(curandState *localState)中通过引用传递随机生成器状态(CUDA工具包3.2 curand.lib…

五里雾 2024-10-01 13:44:01 0 0

curandGenerateNormalDouble 因生成大量随机数而崩溃

是否有任何限制 curandGenerateNormal( curandGenerator_t 生成器, 浮动*outputPtr,size_t n, float 意味着,float stddev) 函数? curandGenerate…

清眉祭 2024-10-01 12:27:11 0 0

CUDA高效多边形填充算法

我需要高效的填充算法来填充闭合多边形(例如扫描线填充),我可以在 CUDA 上运行它。你有什么建议吗? 预先感谢您的重播!…

司马昭之心 2024-10-01 11:22:27 0 0

对 OpenCL 内核(DSP 窗口函数)的分析结果感到困惑

我在 OpenCL 中完成了一个窗口函数内核。基本上,窗口函数只是将一组系数逐个应用于另一组数字(维基百科解释得更好)。在大多数情况下,我能够将窗口…

朦胧时间 2024-10-01 09:34:26 1 0

CUDA:在多个设备之间共享数据?

在《CUDA C 编程指南》中,据说 ...根据设计,主机线程在任何给定时间只能在一个设备上执行设备代码。因此,需要多个主机线程在多个设备上执行设备代…

鹤仙姿 2024-10-01 07:44:28 0 0

CUDA 和 Dev C++

我想知道是否可以在 Dev C++ 中使用 CUDA,有什么想法吗?…

失而复得 2024-10-01 07:17:15 1 0

无法在单个内核代码中找到平均值和方差

亲爱的学者们, 我无法在单个内核调用中实现mean和var。 目标:我需要找到矩阵中子矩阵的均值和方差。所以我写了以下内核 函数: global void kernelM…

十雾 2024-10-01 06:45:21 0 0

cuda浮点精度

有人可以评论一下吗, 我想做一个矢量点积。我的浮点向量是 [2080:2131] 和 [2112:2163],它们每个包含 52 个元素。 a[52] = {2080 2081 2082 ... ...…

我只土不豪 2024-10-01 05:59:18 0 0

我应该创建多个 OpenCL 内核以避免条件语句吗?

在 OpenCL 中,我有一个需要对复杂且真实的数据进行操作的内核。我可以放入一个条件语句来调用正确的代码行来处理这个问题,或者我可以有两个调用的内…

夜光 2024-10-01 04:58:26 0 0

当我使用略多于 64kb 的常量缓存时,为什么我的内核不会失败? (OpenCL/CUDA)

我对使用常量缓存的内核进行了一些测试。如果我使用 16,000 个浮点数 (16,000 * 4KB = 64KB),那么一切都会顺利运行。如果我使用16,200,它仍然运行顺…

梦开始←不甜 2024-10-01 04:49:54 3 0

如何解决依赖OpenCV的GPU程序编译问题?

如何解决这个编译问题呢? 1&gttmpxft_00001548_00000000-14_buildSURFDescriptorsGPU.ii 1&gtCompiling... 1&gtgetMatchesGPU.cpp 1&gtutils.cpp 1&g…

几味少女 2024-10-01 02:56:25 0 0

在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(汽车、人)的工作代码示例?

在哪里可以找到用 OpenCL 或 CUDA 编写的对象检测(计算机视觉的一部分)的工作代码?提前非常感谢。…

寄人书 2024-10-01 01:57:39 0 0

在 CUDA C 中实现 X^i * Y 的和(i=0 到 k)

我正在寻找技巧或研究论文来帮助我计算 X^i * Y 的总和(i=0 到 k),或更明确地说,Y + X^1 * Y +...+ X^k * CUDA C 中的 Y。其中 X 是 N×N 矩阵,Y …

绿光 2024-10-01 01:30:50 0 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文