nvcc

nvcc

文章 0 浏览 4

使用 CUDA 显示 GPU 优于 CPU 的最简单示例

我正在寻找最简洁的代码量,可以为 CPU(使用 g++)和 GPU(使用 nvcc)编写代码,并且 GPU 的性能始终优于 CPU。任何类型的算法都是可以接受的。 澄…

南城旧梦 2024-12-08 08:20:38 0 0

使用 nvcc 在 CUDA 中编译模板函数时出错

我有以下 CUDA 代码: enum METHOD_E { METH_0 = 0, METH_1 }; template inline __device__ int test_func() { return int(METH); } __global__ void …

送你一个梦 2024-12-05 00:19:49 3 0

带有 Boost 的 Cuda

我目前正在编写 CUDA 应用程序,并希望使用 boost:: program_options 库来获取所需的参数和用户输入。 我遇到的问题是 NVCC 无法处理编译 boost 文件 …

原来分手还会想你 2024-12-04 10:36:16 1 0

NVCC 和编译器错误的静态断言

在用于编译时设置的结构中为 NVCC 编译器提供静态断言的最佳方法是什么: 以下内容大部分有效,但有时 NVCC 会产生胡言乱语的错误消息,并且即使应该…

帥小哥 2024-11-19 12:45:08 2 0

将预处理变量传递给 NVCC 来编译 CUDA?

当我使用 NVCC 编译 CUDA 代码并且我已经在代码中定义了一个预处理变量(例如 #define DEBUG_OUTPUT 0)时,有没有办法在编译时动态覆盖这样的变量?…

浅听莫相离 2024-11-16 05:14:43 3 0

寄存器和共享内存取决于编译计算能力?

当我使用 nvcc -arch=sm_13 编译时,我得到: ptxas info : Used 29 registers, 28+16 bytes smem, 7200 bytes cmem[0], 8 bytes cmem[1] 当我使用 nv…

許願樹丅啲祈禱 2024-11-08 06:14:58 5 0

CUDA在设备上静态分配数据

我一直在尝试分配一个可由每个内核函数访问的变量。 我的尝试是下面附加的代码,但它不会编译,因为内核无法查看和访问 dArray。在 C++ 中,您可以将…

晚雾 2024-11-07 00:30:21 3 0

如何让 NVCC 包含宏定义信息?

通常,使用 gcc,您可以使用 -g 指定调试信息的级别,如果使用 -g3,它将在可执行文件中包含预处理器宏定义,gdb 等调试器可以读取这些宏定义,并允许…

杀手六號 2024-11-06 22:47:44 5 0

带有 mingw 的 cuda - 更新

我们一直在 Linux 中开发代码,但想编译 Windows 可执行文件。旧的非 GPU 版本可以在 Windows 中使用 mingw 进行良好的编译,因此我希望能够对 CUDA …

各自安好 2024-11-05 03:13:12 3 0

CUDA:不支持未对齐的内存访问:我错过了什么?

有一些问题类似对此,但在这种情况下,它有点奇怪; NVCC 3.1 不喜欢这样,但 3.2 和 4.0RC 喜欢; float xtmp[MAT1]; for (i=0; i

叶落知秋 2024-11-02 14:45:15 5 0

编译调用 Surface 低级 CUDA API 的代码时出现奇怪的错误

这个最小的例子: int main() { struct surfaceReference* surfaceReferencePointer; cudaGetSurfaceReference(&surfaceReferencePointer, "surfaceRe…

逆光飞翔i 2024-10-26 11:08:32 6 0

无法重载 make_uint4 函数

我尝试按以下方式重载 make_uint4: namespace A { namespace B { inline __host__ __device__ uint4 make_uint4(uint2 a, uint2 b) { return make_ui…

夏至、离别 2024-10-22 16:56:32 8 0

CUDA:为 sm_20 显示错误的 lmem 统计信息?

当 sm_20 GPU 时,使用选项 --ptxas-options=-v 编译的 CUDA 内核似乎显示错误的 lmem(本地内存) 统计信息架构已指定。这同样为 sm_10 / sm_11 / sm…

牵你手 2024-10-19 03:22:31 6 0

Cuda 代码#define 错误,预期出现“)”

在下面的代码中,如果我将 #define N 65536 置于 #if FSIZE 之上,则会出现以下错误: #if FSIZE==1 __global__ void compute_sum1(float *a, float *…

送舟行 2024-10-17 08:58:52 7 0

如何获取要执行的 PTX 文件

我知道如何从 .cu 生成 .ptx 文件以及如何从 .ptx 生成 .cubin 文件。 但我不知道如何获得最终的可执行文件。 更具体地说,我有一个 sample.cu 文件,…

拥抱我好吗 2024-10-14 06:01:06 6 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文