gpgpu

gpgpu

文章 0 浏览 5

有 CUDA 的 Lisp 扩展吗?

我刚刚注意到,WD Hillis 连接机的首批语言之一是 *Lisp,它是具有并行结构的 Common Lisp 的扩展。连接机是一台具有 SIMD 架构的大规模并行计算机,…

冷情妓 2024-11-08 20:56:28 7 0

做工作而不是等待 glMapBuffer

我正在使用 OpenGL 进行一些 GPGPU 处理。所以我有不同的线程为 OpenGL 处理线程提供工作。 在每个“工作项”之后,我需要调用 glReadPixels 和 glMap…

给我一枪 2024-11-08 13:39:43 7 0

编译 Cuda 时出错 - 预期的主要表达式

这个程序看起来不错,但我仍然收到错误,有什么建议吗? 程序: #include "dot.h" #include #include #include int main(int argc, char** argv) { in…

拒绝两难 2024-11-06 21:53:53 7 0

PyCUDA+Threading = 内核调用的无效句柄

我会尽力澄清这一点; 我有两节课; GPU(Object),用于对 GPU 功能的一般访问;multifunc(threading.Thread) 用于我尝试多设备化的特定功能。 GPU 包…

赤濁 2024-11-05 18:17:49 8 0

在 GPU 编程中使用条件时,工作项会执行什么?

如果您有工作项在波前执行,并且有一个条件,例如: if(x){ ... } else{ .... } 工作项执行什么?波前中的所有工作项都将执行第一个分支(即 x == tru…

巴黎盛开的樱花 2024-11-05 13:13:16 10 0

OpenCL 图像直方图

我正在尝试在 OpenCL 中编写直方图内核来计算 RGBA32F 输入图像的 256 bin R、G 和 B 直方图。我的内核看起来像这样: const sampler_t mSampler = CL…

残疾 2024-11-04 20:09:25 8 0

OpenCL getDeviceInfo:如何获取有关 CPU 内内核的信息?

通过 OpenCL 的 getDeviceInfo,我们可以获得可用计算单元的数量 (CL_DEVICE_MAX_COMPUTE_UNITS)。在我的 nVidia Geforce 8600GTS 上,我有 4 个计算…

早乙女 2024-11-04 14:22:30 7 0

OpenCL 写入缓冲区选择

可能的重复: 两种创建缓冲区对象的方法opencl:clCreateBuffer 与 clCreateBuffer + clEnqueueWriteBuffer 在缓冲区创建后立即将数据复制到设备与稍…

南城追梦 2024-11-04 08:26:23 7 0

CUDA 块和网格大小效率

在 cuda 中处理动态大小的数据集的建议方法是什么? 是“根据问题集设置块和网格大小”的情况,还是值得将块尺寸分配为 2 的因子并有一些内核逻辑来处…

当梦初醒 2024-11-03 20:52:21 5 0

pycuda.debug 实际上做了什么?

作为一个更大项目的一部分,我遇到了一个奇怪的一致错误,我无法理解它,但它是一个典型的“黑匣子”错误;当使用 cuda-gdb python -m pycuda.debug p…

红焚 2024-11-03 07:45:52 7 0

GPGPU:仍然处于前沿?

GPGPU 是否已准备好用于生产和原型设计,或者您仍然认为它主要是一种研究/前沿技术?我在计算生物学领域工作,它开始吸引该领域更多以计算机科学为导…

被你宠の有点坏 2024-11-02 16:23:39 6 0

PyCUDA:查询设备状态(特别是内存)

PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…

贪恋 2024-11-02 14:50:40 9 0

CUDA:不支持未对齐的内存访问:我错过了什么?

有一些问题类似对此,但在这种情况下,它有点奇怪; NVCC 3.1 不喜欢这样,但 3.2 和 4.0RC 喜欢; float xtmp[MAT1]; for (i=0; i

叶落知秋 2024-11-02 14:45:15 7 0

CUDA 卡偶尔会因运行中“启动失败”而崩溃,以及 Snow

我想拍一张屏幕上发生的情况的照片,但屏幕截图无法捕获它,但最好的描述是雪。 我的一个项目有一个习惯,就是在新的迭代中随机失败,我总是认为这是…

杀手六號 2024-11-02 09:31:59 6 0

CUDA:分区方法*巨大*问题?

所有这些 CUDA 云雀的力量都令人头晕,但我一直想知道的是 1d 块/网格尺寸的硬限制(通常分别为 512/65535)。 当处理范围更大(数十亿)的问题时,是…

甜警司 2024-11-02 07:13:14 4 0
更多

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待"谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文