第 6 页 - gpgpu - 文江博客

投稿关注

gpgpu

文章 0 浏览 5

GPU 在科学模拟中如何以及在何处使用？

GPU 如何以及在何处用于科学模拟（特别是天体物理学/宇宙学）？…

葵雨 2024-11-29 10:04:04 4 0

opencl 命令队列是如何工作的，我能要求它做什么

我正在研究一种算法，它可以多次执行几乎相同的操作。由于该操作由一些线性代数（BLAS）组成，我想我会尝试使用 GPU 来完成此操作。我已经编写了内核…

白龙吟 2024-11-29 02:55:07 2 0

NVidia CUDA：二级缓存和多个内核调用

我想知道 L2 缓存是否在多个内核调用之间被释放。例如，我有一个内核对数据进行一些预处理，第二个内核则使用它。如果数据大小小于 768 KB 是否可以获…

情深已缘浅 2024-11-28 12:08:09 3 0

有没有办法在 Windows 7 系统中独立执行任务并使用异构多 GPU？

我的台式机上可以有两个混合芯片组/一代 AMD GPU吗？ 6950 和 4870，并专用一个 gpu (4870) 仅用于 opencl/gpgpu 目的，消除操作系统考虑的视频输出或…

爱人如己 2024-11-28 08:44:04 3 0

调用 opencl 需要多长时间？

我目前正在实现一种算法，该算法可以在小矩阵和向量上分配线性代数。代码速度很快，但我想知道在 gpgpu 而不是 cpu 上实现它是否有意义。我能够将大…

咽泪装欢 2024-11-27 23:44:54 3 0

CUDA - 复制到对象数组中的数组

我有一个 CUDA 应用程序，正在处理一组对象；每个对象都有一个指向 std::pair 数组的指针。我正在尝试 cudaMemcpy 对象数组，然后 cudaMemcpy 对每个…

痕至 2024-11-27 14:58:05 3 0

CUDA似乎达到了极限，但那是什么极限呢？

我有一个 CUDA 程序，似乎达到了某些资源的某种限制，但我无法弄清楚该资源是什么。这是内核函数： __global__ void DoCheck(float2* points, int* se…

你又不是我 2024-11-27 12:21:17 3 0

Cuda 中的 CImg 库

我正在 VS2008、Win 7 上的 CUDA C 中编写代码。我得到了一个要显示为图像的浮点数矩阵..我将其保存为 .bin 文件并将其加载到一个单独的 .cpp 文件中…

万劫不复 2024-11-27 03:59:00 4 0

如何测量矩阵乘法内核的 gflops？

在《大规模并行处理器编程》一书中，gflop 的数量用于比较不同矩阵乘法内核的效率。我如何在我自己的机器上为我自己的内核计算这个值？我在 NVIDIA …

樱娆 2024-11-27 02:53:32 2 0

GPU序列化分解

据此， http://www.nvidia.co.uk /content/PDF/isc-2011/Ziegler.pdf，我理解GPU文献中的重放意味着序列化。但影响连载数量的因素有哪些呢？为此，我…

倾城花音 2024-11-25 08:03:02 2 0

GPU中缓存未命中的变化

我一直在玩弄一个 OpenCL 内核，它访问 7 个全局内存缓冲区，对值执行一些操作并将结果存储回第 8 个全局内存缓冲区。正如我所观察到的，随着输入大小…

能否归途做我良人 2024-11-25 05:06:37 2 0

GPU 中的活动扭曲数量 (Fermi)

我有一个关于 GPU 中的活动扭曲的快速问题（我更愿意在费米中知道它）。对于特定的内核，SM中任何周期的活动warp数量在内核的整个执行时间内是否相同…

挽清梦 2024-11-24 04:18:58 2 0

GPU 中的同步

我对 GPU 如何执行同步有一些疑问。据我所知，当一个扭曲遇到障碍时（假设它在 OpenCL 中），它知道同一组的其他扭曲还没有到达那里。所以还得等。但…

A君 2024-11-19 19:21:07 6 0

cudamalloc 比 cudamecpy 慢吗？

我正在编写一个需要时间高效的代码，因此使用 Cufft 来实现此目的，但是当我尝试并行计算非常大的数据的 fft 时，它比 cpu fftw 慢，并且在找到每个时…

栀子花开つ 2024-11-19 16:30:04 4 0

GPU中的上下文切换机制是怎样的？

据我所知，GPU 在扭曲之间切换以隐藏内存延迟。但我想知道在什么情况下，扭曲会被切换出去？例如，如果扭曲执行加载，并且数据已经在缓存中。那么扭曲…

时光病人 2024-11-19 08:07:17 4 0

共 15 页
上一页
4
5
6
7
8
下一页

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

gpgpu

GPU 在科学模拟中如何以及在何处使用？

opencl 命令队列是如何工作的，我能要求它做什么

NVidia CUDA：二级缓存和多个内核调用

有没有办法在 Windows 7 系统中独立执行任务并使用异构多 GPU？

调用 opencl 需要多长时间？

CUDA - 复制到对象数组中的数组

CUDA似乎达到了极限，但那是什么极限呢？

Cuda 中的 CImg 库

如何测量矩阵乘法内核的 gflops？

GPU序列化分解

GPU中缓存未命中的变化

GPU 中的活动扭曲数量 (Fermi)

GPU 中的同步

cudamalloc 比 cudamecpy 慢吗？

GPU中的上下文切换机制是怎样的？

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接