cuda

cuda

文章 23 浏览 77

CUDA __umul24 函数,有用还是没用?

是否值得在 CUDA 内核中用 __umul24 函数替换所有乘法?我读到了不同和相反的观点,但我仍然无法做出一个基准来弄清楚…

み格子的夏天 2024-10-29 08:26:00 0 0

CUDA纹理内存绑定全局内存的子部分

我在绑定到全局设备内存的子部分纹理内存时遇到问题。 我有一个充满内存的大型全局设备数组,如下所示: 双* device_global cudaMalloc((void **)&amp…

写给空气的情书 2024-10-29 07:06:51 1 0

CUDA 卷积 - 不可分离内核

我需要实现一个具有不可分离内核的图像卷积的高效版本(因此 CUDA 的 sdk 仅适用于 FFT 示例,但明确指出它仅适用于大内核大小) 除了从头开始实现它…

枯寂 2024-10-28 21:57:56 1 0

分配共享内存

我试图通过使用常量参数来分配共享内存,但出现错误。我的内核看起来像这样: __global__ void Kernel(const int count) { __shared__ int a[count] }…

瑾夏年华 2024-10-28 21:45:23 2 0

cudaErrorNoDevice GTS250 gentoo

第一个问题是 cudaGetDeviceCount 返回cudaErrorNoDevice: 这表明安装的 CUDA 驱动程序未检测到支持 CUDA 的设备。 cat /proc/driver/nvidia/version…

终陌 2024-10-28 20:10:09 3 0

主力:删除键值数组中的重复项

我有一对大小相等的数组,我将它们称为键和值。 例如: K: V 1: 99 1: 100 1: 100 1: 100 1: 103 2: 103 2: 105 3: 45 3: 67 键已排序,与每个键关联…

您的好友蓝忘机已上羡 2024-10-28 10:55:17 2 0

CUFFT - 填充/初始化问题

我正在查看 Nvidia SDK 的卷积 FFT 示例(对于大内核),我知道傅立叶变换背后的理论及其 FFT 实现(至少是基础知识),但我无法弄清楚以下代码的作用…

只有一腔孤勇 2024-10-28 03:48:22 1 0

推入用户编写的内核

我是 Thrust 的新手。我看到所有 Thrust 演示文稿和示例仅显示主机代码。 我想知道我是否可以将 device_vector 传递给我自己的内核?如何? 如果是,…

小ぇ时光︴ 2024-10-28 03:43:22 1 0

CUDA:块的更多维度还是只有一个?

我需要使用 CUDA 对矩阵的每个元素(基本上是内存中的浮点值向量)求平方根。 矩阵维数不是“先验”已知的,并且可能会有所不同 [2-20.000]。 我想知…

烟花肆意 2024-10-28 03:21:01 1 0

速度权衡:频繁读取文件与使用动态内存存储文件

我正在编写一个 C 程序,其中涉及读取图像文件并仅读取图像的每个像素一次。那么我应该使用 fread() 读取一次文件并将其存储在某个动态变量(堆变量)…

想挽留 2024-10-27 19:57:12 1 0

无法在 Visual Studio 2008 中构建 CUDA 项目

我是贝尔格莱德大学计算机科学专业的一年级学生。我的软计算项目是比较不同基于群体的算法(例如遗传算法、蚁群优化、蜂群、萤火虫和 PSO)的 CUDA 实…

2024-10-27 15:28:29 2 0

如何使用 CUDA 为块 lanczos 算法乘以稀疏矩阵(在 gf(2) 字段上)?

我有一个与块 lanczos 算法(Montengro 版本)相关的学术项目要做。我在设计用于实现块 lanczos 的算法时遇到问题,任何人都可以建议我应该采取什么路…

岁月苍老的讽刺 2024-10-27 14:10:05 3 0

CUDA 上多项式拟合问题的错误

我尝试使用 CUDA 在设备上做一些简单的循环,但似乎很难理解 Cuda。当我将 CUDA 内核函数与普通 C 代码一起使用时,我从每个函数调用中得到 0。 原始…

好久不见√ 2024-10-27 05:28:30 0 0

CUDA:对无符号字符的原子操作

我是 CUDA 初学者。我在全局内存中有一个无符号字符的像素缓冲区,可以由任何和所有线程更新。因此,为了避免像素值出现奇怪现象,我想在线程尝试更新…

渔村楼浪 2024-10-27 03:34:20 1 0

CUBLAS - 矩阵元素求幂可能吗?

我正在使用 CUBLAS(Cuda Blas 库)进行矩阵运算。 是否可以使用 CUBLAS 来实现矩阵项的幂/均方根? 我的意思是,拥有 2x2 矩阵 1 4 9 16 我想要的是…

静谧 2024-10-26 17:21:23 1 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文