在 CUDA C 中运行时确定计算机是否有 GPU
我正在支持 GPU 的计算机上编写代码,但我的代码需要能够移植到没有 GPU 的计算机上。所以我写了2个函数,一个只使用CPU,一个使用CPU+GPU。 我赞成有…
我可以在不更改代码的情况下使用 c# 中的 GPU 内核吗?
我意识到关于这个主题有几个问题,但我相信我的角度是独特的。 我有一个成熟的 C# 应用程序,用于科学数字运算。在代码中,我在 24 个超线程(即我有 …
OpenCL 内核在更快的 GPU 上执行速度更慢
我对 OpenCL 相当陌生,一直在尝试实现 DSP 算法 比较其在不同 GPU 上的性能与标准 CPU 实现的性能。 虽然我已经实现了巨大的性能提升,但我发现奇怪…
如何正确将从全局内存读取的内容合并到具有 Short 或 char 类型元素的共享内存中(假设每个元素有一个线程)?
我对 CUDA 中合并全局内存负载有疑问。目前我需要能够在具有计算能力 CUDA 1.1 或 1.3 的 CUDA 设备上执行。 我正在编写一个 CUDA 内核函数,它将一个…
CUDA 事件对 cudaMalloc 和 cudaMemcpy 执行进行计时吗?
我使用以下代码来计时对 cudaMalloc() 的调用。我很好奇:CUDA 事件是否只为我们的内核计时,或者它们也为“内置内核”计时。换句话说,下面的cudaMal…
OpenCL 标量与矢量
我有简单的内核: __kernel vecadd(__global const float *A, __global const float *B, __global float *C) { int idx = get_global_id(0); C[idx] =…
OpenCV GPU FaceDetector 示例在随机帧上崩溃
我正在使用 OpenCV 2.3.1 中的 GPU 模块尝试基于 Haarcascade 的 FaceDetection。 我的代码正在编译,有时它会显示初始帧,并在输出帧上绘制一个或多…
我们应该使用 cuda Event 来计时推力函数(例如排序)还是应该使用 cpu 计时器
我正在尝试计算推力排序功能的时间。目前,我正在使用 cuda 事件。但我很好奇 cuda 事件是否会给我错误的值。这是因为,在我的计算机上,thrust 在 34…
有没有办法在 AGAL 中进行按位移位操作?
如果我将所有颜色编码为一个浮点值 (RGB),如下所示: //Each Channels are from 0 - 255 red << 16 | green << 8 | blue; 如何在 AGAL 中检索这些颜…
如何找到 CUDA 的 epsilon、min 和 max 常量?
我正在寻找 CUDA 设备的 epsilon(两个数字之间的最小步长)、min(最小量值)和 max(最大量值)的值。 IE 相当于 gcc 编译器中 中定义的 FLT_EPSILO…