第 33 页 - cuda - 文江博客

投稿关注

cuda

文章 23 浏览 77

将纹理与 CUDA 中的固定映射内存绑定

我试图将零拷贝映射的主机内存绑定到纹理，但看起来这是不可能的。这是一个代码示例： float* a float* d_a cudaSetDeviceFlags(cudaDeviceMapHost) …

铃予 2024-08-28 18:00:00 5 0

cmake、gcc、cuda 和 -m32

我发现 CUDA 在我的 Mac 上无法在 64 位模式下工作（或者到目前为止无法运行）。因此我决定将所有内容编译为 32 位。我使用 cmake 2.8 并添加了以下…

递刀给你 2024-08-28 14:59:24 3 0

Java 中 GPGPU/CUDA/OpenCL 的最佳方法？

图形处理单元上的通用计算（GPGPU）是一个非常有吸引力的概念，可以利用适用于任何类型计算的 GPU。我喜欢使用 GPGPU 进行图像处理、粒子和快速几何…

不美如何 2024-08-28 14:00:23 6 0

CUDA 比较数组

尝试制作一个可以比较一对多位图的应用程序。有一个参考位图和多个其他位图。每次比较的结果应该是具有差异的新位图。也许比较位图而不是纹理而不是数…

冷血 2024-08-28 12:14:13 6 0

将 OpenCV 图像数据类型转换为 Devil 图像格式，反之亦然

我想使用支持 CUDA 的 SIFT 库，但我正在使用 OpenCV 驱动程序从网络摄像头获取图像？ Cuda 库使用 Devil 库来处理图像数据类型。我应该将图像从 Ope…

浅笑依然 2024-08-28 02:41:34 6 0

CUDA：在多 GPU 中，内存复制到 GPU 1 的速度较慢

我的公司设置了两个 GTX 295，所以一台服务器中总共有 4 个 GPU，我们有几台服务器。与 GPU 0、2 和 3 相比，我们的 GPU 1 特别慢，因此我编写了一些…

疯狂的代价 2024-08-27 12:46:59 6 0

如何在 MACOSX 上将 GLUT 与 CUDA 结合使用？

我在 MacOsX 上编译使用 GLUT 的 CUDA 程序时遇到问题。这是我用来编译源代码的命令行： nvcc main.c -o main -Xlinker "-L/System/Library/Framework…

半葬歌 2024-08-26 08:48:24 6 0

CUDA：cudaMemcpy 仅在仿真模式下工作

我刚刚开始学习如何使用 CUDA。我正在尝试运行一些简单的示例代码： float *ah, *bh, *ad, *bd ah = (float *)malloc(sizeof(float)*4) bh = (float *…

久夏青 2024-08-26 08:37:28 6 0

CUDA，同样的工作有更多线程 = 尽管占用率更高，但运行时间更长，为什么？

我遇到了一个奇怪的问题，通过增加线程数来增加占用率会降低性能。我创建了以下程序来说明问题： #include &ltstdio.h&gt #include &ltstdlib.h&gt #…

心在旅行 2024-08-25 09:22:09 4 0

CUDA上多线程使用设备变量

我正在玩cuda。目前我有一个问题。我正在测试一个大型数组的特定响应，当我收到响应时，我必须将数据复制到另一个数组上。例如，我的 5 个元素的测…

聚集的泪 2024-08-25 05:47:45 2 0

分配常量内存

我试图在恒定内存中设置我的模拟参数，但没有运气（CUDA.NET）。 cudaMemcpyToSymbol 函数返回 cudaErrorInvalidSymbol。 cudaMemcpyToSymbol 中的第…

池木 2024-08-25 05:17:59 6 0

Cuda GPU 优化

我读到，当您使用 NVIDIA GPU 而不是 CPU 时，某些问题的加速速度可达到 100 倍。在不同问题上使用 cuda 的最佳性能加速时序是什么。如果可能，请说…

恋你朝朝暮暮 2024-08-25 04:34:28 5 0

GPU编程——传输瓶颈

由于我希望 GPU 为我做一些计算，因此我对测量“纹理”上传和下载速度的主题感兴趣 - 因为我的“纹理”是 GPU 应该处理的数据。我知道从主内存传输到…

铁憨憨 2024-08-25 00:48:30 5 0

用推力调用手写的CUDA内核

由于我需要使用 CUDA 对大量数字进行排序，因此我使用推力。到目前为止，一切都很好......但是当我想调用一个“手写”内核，并有一个包含数据的 Thrus…

笑梦风尘 2024-08-24 18:17:57 9 0

Thrust（CUDA 库）编译错误，如““vectorize_from_shared_kernel__entry” : 不是“thrust::detail::device::cuda”的成员

我使用 CUDA VS Wizard 创建一个 VS 项目，并尝试使用 Thrust 构建一个 cuda 程序，测试程序非常简单： // ignore headers int main(void) { thrust::…

单身狗的梦 2024-08-24 16:48:44 6 0

謌踐踏愛綪

文章 0 评论 0

关注

开始看清了

文章 0 评论 0

关注

高速公鹿

文章 0 评论 0

关注

alipaysp_PLnULTzf66

文章 0 评论 0

关注

热情消退

文章 0 评论 0

关注

白色月光

文章 0 评论 0

友情链接

文江博客

cuda

将纹理与 CUDA 中的固定映射内存绑定

cmake、gcc、cuda 和 -m32

Java 中 GPGPU/CUDA/OpenCL 的最佳方法？

CUDA 比较数组

将 OpenCV 图像数据类型转换为 Devil 图像格式，反之亦然

CUDA：在多 GPU 中，内存复制到 GPU 1 的速度较慢

如何在 MACOSX 上将 GLUT 与 CUDA 结合使用？

CUDA：cudaMemcpy 仅在仿真模式下工作

CUDA，同样的工作有更多线程 = 尽管占用率更高，但运行时间更长，为什么？

CUDA上多线程使用设备变量

分配常量内存

Cuda GPU 优化

GPU编程——传输瓶颈

用推力调用手写的CUDA内核

Thrust（CUDA 库）编译错误，如““vectorize_from_shared_kernel__entry” : 不是“thrust::detail::device::cuda”的成员

热门标签

推荐作者

謌踐踏愛綪

开始看清了

高速公鹿

alipaysp_PLnULTzf66

热情消退

白色月光

友情链接