cuda

cuda

文章 23 浏览 77

编译特定代码将我的纹理设为 NULL

一个非常奇怪的错误:如果我向我的项目添加一些特定的代码,我使用的任何纹理都只包含 0。即使我没有运行任何添加的代码。 这里的具体代码是 nVidia C…

满天都是小星星 2024-09-12 20:03:33 4 0

CUDA中二维数组的有效缩减?

CUDA SDK 中提供了示例代码和演示幻灯片,可实现高效的一维缩减。我还看过几篇关于 CUDA 中一维缩减和前缀扫描的论文和实现。 是否有高效的 CUDA 代码…

╄→承喏 2024-09-12 13:27:10 9 0

DirectX/Cuda/OpenGL 可访问的总内存/纹理内存

有人可以解释一下 Cuda 上下文中使用的纹理内存与 DirectX 上下文中使用的纹理内存的区别吗?假设一个显卡有512MB的标称内存,它是如何划分为常量内存…

旧时光的容颜 2024-09-12 10:35:56 4 0

我可以调用“类似函数的宏”吗?在 CUDA __global__ 函数的头文件中?

这是我的头文件 aes_locl.h 的一部分: . . # define SWAP(x) (_lrotl(x, 8) &amp 0x00ff00ff | _lrotr(x, 8) &amp 0xff00ff00) # define GETU32(p) S…

绅士风度i 2024-09-12 00:26:06 10 0

CUDA - 维护指向全局内存的指针

我有一个使用 CUDA 的 .NET 程序。 CUDA 通过 C DLL 访问。 我正在做的是通过在程序启动时在设备上分配缓冲区(cudaMalloc)来初始化我的 CUDA 应用程…

感情洁癖 2024-09-11 11:22:45 7 0

CUDA 中的并行搜索

是否有用于搜索操作的 CUDA 方法/途径/库,例如百万条目数组中的整数?更多的是并行搜索方法..…

无畏 2024-09-11 05:06:02 7 0

CUDA 基本矩阵加法 - 大矩阵

我正在尝试添加两个 4800x9600 矩阵,但遇到了困难... 这是一个简单的 C=A+B 操作... 这是内核: __global__ void matAdd_kernel(float* result,float…

末骤雨初歇 2024-09-11 03:36:11 8 0

我可以在主机进程之间共享 cuda GPU 设备内存吗?

是否可以有两个或多个 Linux 主机进程可以访问相同的设备内存? 我有两个进程在它们之间传输高数据速率,我不想将数据从 GPU 传回进程 A 中的主机,只…

放血 2024-09-10 23:25:42 7 0

传递给 CUDA 的结构中的指针

我已经搞砸了一段时间了,但似乎无法正确处理。我正在尝试将包含数组的对象复制到 CUDA 设备内存中(然后再次复制回来,但当我到达它时我会跨过那座桥…

黑白记忆 2024-09-10 18:18:47 5 0

C++自定义例外

我遇到了损坏的编译器,它不允许从 std::exception (nvcc 3.0) 继承异常。 所以必须创建解决方法: struct exception { explicit exception(const cha…

本宫微胖 2024-09-10 05:44:38 4 0

多次调用 get_global_id() 与将结果保存在局部变量中?

这可能是一个愚蠢的问题,但是: 在 OpenCL 内核中调用某些 get_* 函数的成本有多高?是将结果保存在某些局部变量中以供将来使用更好,还是在需要时调…

蔚蓝源自深海 2024-09-10 05:03:48 4 0

CUDA超时? / 费米 / gtx465

我在 MS VS2005 上使用 CUDA SDK 3.1,GPU GTX465 1 GB。我有这样一个内核函数: __global__ void CRT_GPU_2(float *A, float *X, float *Y, float *Z…

雨落星ぅ辰 2024-09-10 03:33:19 5 0

CUDA内核中的线程层次结构设计

假设一个块的线程限制为 512 个,假设我的内核需要超过 512 个线程来执行,那么应该如何设计线程层次结构以获得最佳性能? (情况 1) 第一个块 - 512…

沙与沫 2024-09-09 19:04:13 0 0

使用 OpenMP 支持编译和链接 CUDA 源文件

是否可以在 CUDA 源文件(而不是内核代码)中使用 OpenMP 编译指示? 我将结合 GPU 和 CPU 计算。但是,当我使用 openmp 选项(在 Linux 下)链接程序…

指尖上得阳光 2024-09-09 03:10:20 4 0

如何以编程方式确定 GPU 的内存总线宽度和时钟速率?

如何以编程方式确定 GPU 的内存总线宽度和内存时钟速率?我想使用这些数字来计算最大理论内存带宽。我最感兴趣的是 NVIDIA GPU。…

心欲静而疯不止 2024-09-09 00:39:34 5 0
更多

推荐作者

linfzu01

文章 0 评论 0

可遇━不可求

文章 0 评论 0

枕梦

文章 0 评论 0

qq_3LFa8Q

文章 0 评论 0

JP

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文