gpgpu

gpgpu

文章 0 浏览 5

PyCUDA:C/C++包括?

任何地方都没有真正提到(至少我可以看到)是哪些库函数暴露给内联 CUDA 内核。 具体来说,我正在执行小型/愚蠢的矩阵乘法,这些乘法不值得单独卸载到…

风轻花落早 2024-10-31 17:41:00 8 0

数据库和 GPGPU

GPGPU 在许多任务(不是全部)上都有很大的潜力,特别是处理数据库中的矩阵,至少根据围绕该主题的所有 PR。 我仍然没有找到使用 GPGPU 来加速性能的…

意犹 2024-10-30 03:42:29 5 0

GTS 250 和 Fermi 器件之间的 CUDA 块同步差异

所以我一直在研究一个在全局内存中创建哈希表的程序。该代码在 GTS250(Compute 1.1 设备)上完全可用(尽管速度较慢)。但是,在 Compute 2.0 设备(…

你列表最软的妹 2024-10-29 23:10:51 8 0

如何从 OpenCL 代码启动另一个线程?

我的算法由两个步骤组成: 数据生成。在此步骤中,我循环生成数据数组作为某些函数结果 数据处理。对于这一步,我编写了 OpenCL 内核,用于处理上一步…

七度光 2024-10-22 07:34:45 8 0

有关数据并行编程和算法的好书籍和资源

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

朕就是辣么酷 2024-10-22 02:05:39 5 0

CUDA 和 HPC 中的一维问题

我正在寻找 CUDA 和 HPC 中的一些一维问题,例如 Black Scholes。 我所说的一维问题是指所有工作都在一维数组上完成的问题。虽然矩阵乘法可以用这种方…

浅语花开 2024-10-21 18:26:00 10 0

CUDA warp 中的线程是否在多处理器上并行执行?

一个经纱是 32 个线程。 32 个线程在多处理器中并行执行吗? 如果 32 个线程没有并行执行,则 warp 中不存在竞争条件。 在看了一些例子后我产生了这个…

梦纸 2024-10-21 08:38:25 7 0

OpenCL 本地内存有限制吗?

今天,我向内核添加了四个 __local 变量以转储中间结果。但是,只需将这四个变量添加到内核签名并添加相应的内核参数,就会将内核的所有输出呈现为“0…

似梦非梦 2024-10-21 01:36:12 12 0

有多少个“CUDA 核心”? GPU 的每个多处理器都有吗?

我知道 Fermi 架构之前的设备在单个多处理器中具有 8 个 SP。费米架构中的计数相同吗?…

べ繥欢鉨o。 2024-10-20 15:28:23 5 0

“空”使用 openGL 进行渲染

规格:Radeon 3870HD,带 openGL 3.3 和GLSL 1.5 我通过计算着色器渲染数据。由于依赖性,我必须将所有数据放入统一的纹理中,并且没有留下任何属性。…

人疚 2024-10-19 14:26:33 6 0

C++ 中的高效矩阵分解为方形子矩阵

我通过使用一维数据类型并将其包装成行和列,在 C++ 中实现了矩阵数据类型。现在,我希望能够从此时开始创建方形/分块子矩阵,并且我想在内存中进行操…

屋顶上的小猫咪 2024-10-17 17:56:59 5 0

在 Mac 上使用 JOCL 的帮助

我正在尝试在我的 Mac 上运行本教程。 本教程适用于 Windows,并打包了 jocl 版本 1.3 (JOCL-0.1.3a-beta.jar) 和适用于 Windows 的本机 jocl dll (JO…

情绪失控 2024-10-16 19:32:03 3 0

CUDA int4 按位运算

我想知道 CUDA 的向量类型(如 int4/int2)是否有可用的按位运算?我在 cutil_math.h 中看到很多辅助函数,但没有任何位(左移/右移)操作,所以我可…

甜中书 2024-10-16 13:05:41 5 0

什么是真正的 C++ CUDA 设备代码支持的语言结构?

CUDA 文档 3.2 版本的附录 D 提到了 CUDA 设备代码中的 C++ 支持。 明确提到CUDA支持“计算能力2.x设备的类”。但是,我正在使用计算能力 1.1 和 1.3 …

叹梦 2024-10-15 19:11:11 8 0

Cuda 中的线程索引

我在我的 8000 系列设备(支持 CUDA)上运行以下代码: #include __global__ void testSet(int * MyBlock) { unsigned int ThreadIDX= threadIdx.x+bl…

孤者何惧 2024-10-14 22:11:08 11 0
更多

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待"谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文