gpu

gpu

文章 19 浏览 95

在 CUDA C 中运行时确定计算机是否有 GPU

我正在支持 GPU 的计算机上编写代码,但我的代码需要能够移植到没有 GPU 的计算机上。所以我写了2个函数,一个只使用CPU,一个使用CPU+GPU。 我赞成有…

汹涌人海 2024-12-29 08:38:47 2 0

OpenCV积分图像像素访问错误

我已经用头撞墙大约一周了,因为我无法正确访问积分图像的像素值。我删除了之前的帖子,因为这是我的问题的更具体的例子。 我已经查明了确切的问题,…

自控 2024-12-29 07:14:49 2 0

我可以在不更改代码的情况下使用 c# 中的 GPU 内核吗?

我意识到关于这个主题有几个问题,但我相信我的角度是独特的。 我有一个成熟的 C# 应用程序,用于科学数字运算。在代码中,我在 24 个超线程(即我有 …

岁月苍老的讽刺 2024-12-28 20:14:37 1 0

OpenCL 内核在更快的 GPU 上执行速度更慢

我对 OpenCL 相当陌生,一直在尝试实现 DSP 算法 比较其在不同 GPU 上的性能与标准 CPU 实现的性能。 虽然我已经实现了巨大的性能提升,但我发现奇怪…

最近可好 2024-12-28 18:55:18 2 0

如何正确将从全局内存读取的内容合并到具有 Short 或 char 类型元素的共享内存中(假设每个元素有一个线程)?

我对 CUDA 中合并全局内存负载有疑问。目前我需要能够在具有计算能力 CUDA 1.1 或 1.3 的 CUDA 设备上执行。 我正在编写一个 CUDA 内核函数,它将一个…

情深如许 2024-12-28 12:52:58 2 0

CUDA 事件对 cudaMalloc 和 cudaMemcpy 执行进行计时吗?

我使用以下代码来计时对 cudaMalloc() 的调用。我很好奇:CUDA 事件是否只为我们的内核计时,或者它们也为“内置内核”计时。换句话说,下面的cudaMal…

蝶舞 2024-12-28 11:01:33 3 0

OpenCL 标量与矢量

我有简单的内核: __kernel vecadd(__global const float *A, __global const float *B, __global float *C) { int idx = get_global_id(0); C[idx] =…

白云不回头 2024-12-28 05:20:58 2 0

OpenCV GPU FaceDetector 示例在随机帧上崩溃

我正在使用 OpenCV 2.3.1 中的 GPU 模块尝试基于 Haarcascade 的 FaceDetection。 我的代码正在编译,有时它会显示初始帧,并在输出帧上绘制一个或多…

梅倚清风 2024-12-28 01:37:30 1 0

我们应该使用 cuda Event 来计时推力函数(例如排序)还是应该使用 cpu 计时器

我正在尝试计算推力排序功能的时间。目前,我正在使用 cuda 事件。但我很好奇 cuda 事件是否会给我错误的值。这是因为,在我的计算机上,thrust 在 34…

别理我 2024-12-27 21:21:51 0 0

如何计算CPU的总时间+图形处理器

我在 CPU 上进行一些计算,然后将数字传输到 GPU 并在那里做一些工作。我想计算在 CPU + GPU 上进行计算所需的总时间。我该怎么做?…

一笑百媚生 2024-12-27 21:08:23 0 0

有没有办法在 AGAL 中进行按位移位操作?

如果我将所有颜色编码为一个浮点值 (RGB),如下所示: //Each Channels are from 0 - 255 red << 16 | green << 8 | blue; 如何在 AGAL 中检索这些颜…

七颜 2024-12-27 20:18:52 1 0

opencl中的时钟()

我知道CUDA中有一个函数clock(),你可以在其中放入内核代码并查询GPU时间。但我想知道OpenCL中是否存在这样的东西?有没有办法查询OpenCL中的GPU时间…

素染倾城色 2024-12-26 22:08:11 0 0

OpenCV卷积核大小

这在某种程度上是对上个月早些时候发布的问题的后续。 在将我的工作移植到工作计算机时,我遇到了一些新的卷积问题。 所以,我的内核大小是 30x30,现…

月下伊人醉 2024-12-26 16:39:12 0 0

GL/CL 互操作性:共享纹理

我打算用OpenCL进行图形计算,例如光线投射、光线行进等。我想使用 OpenGL 来显示此计算的结果(像素图像)。我使用附加到帧缓冲区的纹理缓冲区。 Ope…

囍孤女 2024-12-26 00:38:41 0 0

如何找到 CUDA 的 epsilon、min 和 max 常量?

我正在寻找 CUDA 设备的 epsilon(两个数字之间的最小步长)、min(最小量值)和 max(最大量值)的值。 IE 相当于 gcc 编译器中 中定义的 FLT_EPSILO…

潇烟暮雨 2024-12-25 22:48:33 0 0
更多

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文