第 29 页 - cuda - 文江博客

投稿关注

cuda

文章 23 浏览 77

编译特定代码将我的纹理设为 NULL

一个非常奇怪的错误：如果我向我的项目添加一些特定的代码，我使用的任何纹理都只包含 0。即使我没有运行任何添加的代码。这里的具体代码是 nVidia C…

满天都是小星星 2024-09-12 20:03:33 4 0

CUDA中二维数组的有效缩减？

CUDA SDK 中提供了示例代码和演示幻灯片，可实现高效的一维缩减。我还看过几篇关于 CUDA 中一维缩减和前缀扫描的论文和实现。是否有高效的 CUDA 代码…

╄→承喏 2024-09-12 13:27:10 9 0

DirectX/Cuda/OpenGL 可访问的总内存/纹理内存

有人可以解释一下 Cuda 上下文中使用的纹理内存与 DirectX 上下文中使用的纹理内存的区别吗？假设一个显卡有512MB的标称内存，它是如何划分为常量内存…

旧时光的容颜 2024-09-12 10:35:56 4 0

我可以调用“类似函数的宏”吗？在 CUDA global 函数的头文件中？

这是我的头文件 aes_locl.h 的一部分： . . # define SWAP(x) (_lrotl(x, 8) &amp 0x00ff00ff | _lrotr(x, 8) &amp 0xff00ff00) # define GETU32(p) S…

绅士风度i 2024-09-12 00:26:06 10 0

CUDA - 维护指向全局内存的指针

我有一个使用 CUDA 的 .NET 程序。 CUDA 通过 C DLL 访问。我正在做的是通过在程序启动时在设备上分配缓冲区（cudaMalloc）来初始化我的 CUDA 应用程…

感情洁癖 2024-09-11 11:22:45 7 0

CUDA 中的并行搜索

是否有用于搜索操作的 CUDA 方法/途径/库，例如百万条目数组中的整数？更多的是并行搜索方法..…

无畏 2024-09-11 05:06:02 7 0

CUDA 基本矩阵加法 - 大矩阵

我正在尝试添加两个 4800x9600 矩阵，但遇到了困难... 这是一个简单的 C=A+B 操作... 这是内核： __global__ void matAdd_kernel(float* result,float…

末骤雨初歇 2024-09-11 03:36:11 8 0

我可以在主机进程之间共享 cuda GPU 设备内存吗？

是否可以有两个或多个 Linux 主机进程可以访问相同的设备内存？我有两个进程在它们之间传输高数据速率，我不想将数据从 GPU 传回进程 A 中的主机，只…

放血 2024-09-10 23:25:42 7 0

传递给 CUDA 的结构中的指针

我已经搞砸了一段时间了，但似乎无法正确处理。我正在尝试将包含数组的对象复制到 CUDA 设备内存中（然后再次复制回来，但当我到达它时我会跨过那座桥…

黑白记忆 2024-09-10 18:18:47 5 0

C++自定义例外

我遇到了损坏的编译器，它不允许从 std::exception (nvcc 3.0) 继承异常。所以必须创建解决方法： struct exception { explicit exception(const cha…

本宫微胖 2024-09-10 05:44:38 4 0

多次调用 get_global_id() 与将结果保存在局部变量中？

这可能是一个愚蠢的问题，但是：在 OpenCL 内核中调用某些 get_* 函数的成本有多高？是将结果保存在某些局部变量中以供将来使用更好，还是在需要时调…

蔚蓝源自深海 2024-09-10 05:03:48 4 0

CUDA超时？ / 费米 / gtx465

我在 MS VS2005 上使用 CUDA SDK 3.1，GPU GTX465 1 GB。我有这样一个内核函数： __global__ void CRT_GPU_2(float *A, float *X, float *Y, float *Z…

雨落星ぅ辰 2024-09-10 03:33:19 5 0

CUDA内核中的线程层次结构设计

假设一个块的线程限制为 512 个，假设我的内核需要超过 512 个线程来执行，那么应该如何设计线程层次结构以获得最佳性能？（情况 1）第一个块 - 512…

沙与沫 2024-09-09 19:04:13 0 0

使用 OpenMP 支持编译和链接 CUDA 源文件

是否可以在 CUDA 源文件（而不是内核代码）中使用 OpenMP 编译指示？我将结合 GPU 和 CPU 计算。但是，当我使用 openmp 选项（在 Linux 下）链接程序…

指尖上得阳光 2024-09-09 03:10:20 4 0

如何以编程方式确定 GPU 的内存总线宽度和时钟速率？

如何以编程方式确定 GPU 的内存总线宽度和内存时钟速率？我想使用这些数字来计算最大理论内存带宽。我最感兴趣的是 NVIDIA GPU。…

心欲静而疯不止 2024-09-09 00:39:34 5 0

linfzu01

文章 0 评论 0

关注

§对你不离不弃

文章 0 评论 0

关注

可遇━不可求

文章 0 评论 0

关注

枕梦

文章 0 评论 0

关注

qq_3LFa8Q

文章 0 评论 0

关注

JP

文章 0 评论 0

友情链接

文江博客

cuda

编译特定代码将我的纹理设为 NULL

CUDA中二维数组的有效缩减？

DirectX/Cuda/OpenGL 可访问的总内存/纹理内存

我可以调用“类似函数的宏”吗？在 CUDA global 函数的头文件中？

CUDA - 维护指向全局内存的指针

CUDA 中的并行搜索

CUDA 基本矩阵加法 - 大矩阵

我可以在主机进程之间共享 cuda GPU 设备内存吗？

传递给 CUDA 的结构中的指针

C++自定义例外

多次调用 get_global_id() 与将结果保存在局部变量中？

CUDA超时？ / 费米 / gtx465

CUDA内核中的线程层次结构设计

使用 OpenMP 支持编译和链接 CUDA 源文件

如何以编程方式确定 GPU 的内存总线宽度和时钟速率？

热门标签

推荐作者

linfzu01

§对你不离不弃

可遇━不可求

枕梦

qq_3LFa8Q

JP

友情链接