cuda

cuda

文章 23 浏览 77

CUDA 纹理和夹紧

有什么方法可以将超出范围的纹理地址限制为某个值吗?就我而言,我希望将它们设置为简单的零,但我需要的地址模式似乎不存在。 谢谢。 编辑:知道 cud…

镜花水月 2024-11-03 01:39:58 1 0

共享内存上的原子操作

如何在共享内存上执行原子操作? 我有类似的东西: __shared__ int a[10] //set a if(tid&lt5) a[2]++ 因此 5 个线程正在递增 a。我该怎么做? 我知道…

╰ゝ天使的微笑 2024-11-03 01:07:05 1 0

如何在 Fortran 中创建自定义数组?

我一直在考虑将 cuda 库移植到 Fortran。 PGI 和 EM Photonics 似乎是目前存在的两个库。但是我只在这里找到了我正在寻找的东西 real, device, alloca…

任谁 2024-11-02 22:53:22 1 0

CUDA 扭曲和占用

我一直认为warp调度程序一次会执行一个warp,具体取决于哪个warp已准备好,并且这个warp可以来自多处理器中的任何一个线程块。然而,在 Nvidia 网络研…

三生池水覆流年 2024-11-02 18:00:42 0 0

GPU设备模拟器

我是学习 CUDA 的新手,我一直在寻找一个好的模拟器来运行我的 CUDA 程序,因为我的笔记本电脑没有配备显卡。 我听说过 mcuda 和 gpuocelot,但他们的…

救赎№ 2024-11-02 17:12:56 1 0

推力:sort_by_key 和 zip_iterator 性能

问题 我正在使用 sort_by_key 并使用 zip_iterator 传递值。这个 sort_by_key 被调用了很多次,并且在一定的迭代之后,它变得慢十倍!造成性能下降的…

花心好男孩 2024-11-02 17:02:58 0 0

GPGPU:仍然处于前沿?

GPGPU 是否已准备好用于生产和原型设计,或者您仍然认为它主要是一种研究/前沿技术?我在计算生物学领域工作,它开始吸引该领域更多以计算机科学为导…

被你宠の有点坏 2024-11-02 16:23:39 1 0

学习共享内存、分布式内存和/或 GPU 编程的示例问题和解决方案是什么?

我们正在寻找将在任何或所有共享内存、分布式内存和 GPGPU 架构上运行的示例问题和代码。我们使用的参考平台是LittleFe (littlefe.net),这是一个开放…

盗琴音 2024-11-02 16:14:05 1 0

使用 Optimus 的笔记本电脑上的 CUDA 出现问题

我已在配备 GeForce GT 325M (Win7 x64) 的 ASUS N61J 上安装了 CUDA 工具包 v4.0 RC2。 设法将 Cuda 与 Visual Studio 2010 集成。 我尝试运行从这里…

冰葑 2024-11-02 15:32:51 1 0

PyCUDA:查询设备状态(特别是内存)

PyCUDA 的文档顺便提到了 驱动程序接口 调用,但我有点思考并且可以'我不知道如何从我的代码中获取诸如“SHARED_SIZE_BYTES”之类的信息。 谁能向我指…

贪恋 2024-11-02 14:50:40 1 0

CUDA:不支持未对齐的内存访问:我错过了什么?

有一些问题类似对此,但在这种情况下,它有点奇怪; NVCC 3.1 不喜欢这样,但 3.2 和 4.0RC 喜欢; float xtmp[MAT1] for (i=0 i&ltMAT1 i++){ xtmp[i…

叶落知秋 2024-11-02 14:45:15 1 0

在 CUDA 内核中使用虚拟函数

所以我想在设备上分配一个具有虚拟函数的对象,然后调用内核并执行其中一些虚拟函数。我尝试了两种方法来做到这一点,但都不起作用: 1)使用 cudaMal…

栩栩如生 2024-11-02 12:09:08 0 0

将 matlab FFT 转换为 CUDA FFT

我目前正在使用以下 matlab 函数: function out = fft_2d(in) out = fftshift(fft2(ifftshift(in))) 据我了解,这需要一个“自然顺序”输入,并将其…

橘香 2024-11-02 12:06:50 2 0

CUDA:获取数组中的最大值及其索引

我有几个块,每个块在整数数组的单独部分上执行。举个例子:第一个块从数组[0]到数组[9],第二个块从数组[10]到数组[20]。 我可以获得每个块的数组最…

四叶草在未来唯美盛开 2024-11-02 11:08:26 1 0

与 FFT 进行卷积,这是如何工作的?

我知道在时域中卷积是两个矩阵之间相当昂贵的运算,您可以通过在复平面中变换它们并使用乘法(然后返回时域)在频域中执行它 无论如何我不明白这是怎…

假面具 2024-11-02 10:30:42 1 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文