为什么我的 OpenCL 内核无法使用特定参数执行
我有一个在 JOCL 中运行的 OpenCL 内核,它通过了我的所有 JUnit 测试。我将代码移植到 C++ 中,这样我就可以在相同条件下分析内核。除一种情况外,驱…
带 VDPAU 的 GStreamer(使用 nVidia 卡进行 h264 加速)
我使用最新版本的 gstreamer 插件很糟糕,我想尝试 VDPAU。 我用搅拌机基金会的大兔子电影进行了测试。 我尝试过这个命令: gst-launch-0.10 filesrc=…
如何让Windows Phone 7模拟器使用硬件加速?
我在一台较旧的 MacBook Pro 上运行 Windows Phone 7 开发工具,配备 NVIDIA GeForce 9400M 显卡和 256MB 内存(不确定是否共享),并且模拟器上的动…
对 OpenCL 内核(DSP 窗口函数)的分析结果感到困惑
我在 OpenCL 中完成了一个窗口函数内核。基本上,窗口函数只是将一组系数逐个应用于另一组数字(维基百科解释得更好)。在大多数情况下,我能够将窗口…
我应该创建多个 OpenCL 内核以避免条件语句吗?
在 OpenCL 中,我有一个需要对复杂且真实的数据进行操作的内核。我可以放入一个条件语句来调用正确的代码行来处理这个问题,或者我可以有两个调用的内…
用于 MD5 加密的 Nvidia CUDA 或 ATI Stream?
当我看到一些我不知道的有关 ATI 的统计数据时,我正准备购买 Nvidia GTX 470。 ATI 卡上的流是否能更好地执行加密和解密所需的数学运算?…
OpenCL/CUDA 中每种内存访问类型有多少内存延迟周期?
我浏览了编程指南和最佳实践指南,其中提到全局内存访问需要 400-600 个周期。我没有看到太多其他内存类型,如纹理缓存、常量缓存、共享内存。寄存器…
大型矩阵的 CUDA 矩阵乘法中断
我有以下矩阵乘法代码,使用 CUDA 3.2 和 VS 2008 实现。我在 Windows Server 2008 r2 enterprise 上运行。我正在运行 Nvidia GTX 480。以下代码可以…
为什么 OpenCL 矢量加法 Nvidia SDK 示例使用异步写入?
矢量加法示例有以下代码: // Asynchronous write of data to GPU device ciErr1 = clEnqueueWriteBuffer(cqCommandQueue, cmDevSrcA, CL_FALSE, 0, s…
CUDA 内核在 2 个不同的 GPU 上抛出不同的结果(GeForce 8600M GT 与 Quadro FX 770M)
我一直在开发 AES CUDA 应用程序,并且有一个在 GPU 上执行 ECB 加密的内核。为了确保并行运行时算法的逻辑不会被修改,我发送 NIST 提供的已知输入测…
.Net Lib\Wrapper 可以清除 ATI 和 Nvidea API 之间用于计算 GPU 的差异吗?
我想使用 GPU 进行计数。如果没有找到 GPU,我需要它落在 CPU 上并为我提供统一的 api。 (对任何 .net 感兴趣,例如 4)…
计算教授的非相干和相干 gst/gld 场? (CUDA/OpenCL)
我正在使用 Compute Prof 3.2 和 Geforce GTX 280。我相信我的计算能力为 1.3。 此文件,似乎表明我应该能够看到这些字段,因为我使用的是 1.x 计算设…