thrust

thrust

文章 0 浏览 4

哪一个更快?原始指针与推力向量

我是 Cuda 的初学者,我只是想问一个简单的问题,但我找不到任何明确的答案。 我知道我们可以使用原始指针在设备内存中定义数组: int *raw_ptr; cuda…

白衬杉格子梦 2025-01-13 16:06:46 0 0

CUDA:将不同线程中的向量堆栈到一维向量

我在 CUDA 中的每个线程都有一个推力向量,我想按顺序堆叠向量(线程 0 中的向量,线程 1 中的向量,......以及线程 n 中的向量)以创建 1d 向量并发…

魂ガ小子 2025-01-12 17:47:26 0 0

指定结束位时 cub::DeviceRadixSort 失败

我正在使用 CUB 库的 GPU 基数排序算法对 N 个 32 位无符号整数进行排序,这些整数的值都仅使用 32 位中的 k 个,从最低有效位开始。 因此,我在调用 …

半衬遮猫 2025-01-10 20:36:29 2 0

如何在 Thrust 中减少一维二维数据

我是 CUDA 和推力库的新手。我正在学习并尝试实现一个函数,该函数将有一个 for 循环执行推力函数。有没有办法将这个循环转换为另一个推力函数?或者…

时间你老了 2025-01-10 09:26:29 1 0

NVidia 利用三维网格推力任意变换

我想使用 NVidia Thrust 在 GPU 上并行化以下嵌套 for 循环。 // complex multiplication inline __host__ __device__ float2 operator* (const float…

风渺 2025-01-09 18:14:13 1 0

有没有更好更快的方法使用推力从CPU内存复制到GPU?

最近我经常使用推力。我注意到,为了使用推力,必须始终将数据从 cpu 内存复制到 GPU 内存。 让我们看下面的示例: int foo(int *foo) { host_vector …

双手揣兜 2025-01-07 08:55:10 2 0

快速CUDA推力自定义比较运算符

我正在评估 CUDA,目前使用 Thrust 库对数字进行排序。 我想为推力::排序创建我自己的比较器,但它的速度大大减慢! 我通过从 function.h 复制代码来…

花想c 2024-12-29 04:15:18 1 0

在 CUDA 中混合自定义内存管理和 Thrust

在我的项目中,我实现了一个自定义内存分配器,以避免在应用程序“预热”后不必要地调用 cudaMalloc。此外,我使用自定义内核进行基本数组填充、数组…

雨巷深深 2024-12-28 23:27:41 2 0

通过 CUDA Thrust 查找键出现的次数以及键第一次出现的位置

假设我有一个键向量, thrust::device_vector keys(10); keys[0] = 51; // -----> keys[1] = 51; keys[2] = 72; // -----> keys[3] = 72; keys[4] = 7…

叹沉浮 2024-12-26 04:40:13 2 0

Thrust::device_reference 不能与 printf 一起使用吗?

我正在使用推力分区函数将数组划分为偶数和奇数。但是,当我尝试显示设备向量时,它显示随机值。请让我知道错误在哪里。我认为我所做的一切都是正确的…

你的背包 2024-12-23 05:23:25 2 0

直接在主机上访问设备向量元素的最快方法

我建议您参阅以下页面 http://code.google.com/p/thrust /wiki/QuickStartGuide#Vectors。请参阅第二段,它说 另请注意,可以访问 device_vector 的各…

世界和平 2024-12-23 03:39:18 1 0

对用户定义结构的 Thrust::device_vector 执行独占扫描。编译错误

我正在修改 CUDA 提供的 Thrust 库。我试图对用户定义的结构的设备向量执行包含和独占扫描。这是代码。 #include #include #include #include #includ…

开始看清了 2024-12-23 02:45:47 1 0

Thrust/cudpp 中查找第 k 个最小元素的算法

我正在 Thrust/cudapp 中寻找第 k 个最小元素算法的实现。我用谷歌搜索但似乎没有找到。有谁知道是否存在这样的算法? 我看到有重新排序,但没有说第 …

望喜 2024-12-22 20:31:07 2 0

快速处理交错数据

在推力中处理交错数据的最佳方法是什么,假设我想添加交错长度等于 3 的值,例如: [1, 2, 3, 4, 5, 6] 将给出 [6, 15] 或解交错数据,所以 [1, 2, 3,…

穿透光 2024-12-21 00:21:08 2 0

CUDA Stream 压缩:理解概念

我正在使用 CUDA/Thrust/CUDPP。据我了解,在流压缩中,数组中的某些项目被标记为无效,然后“删除”。 那么“移除”到底是什么意思呢?假设原始数组 …

静谧幽蓝 2024-12-19 17:52:30 1 0
更多

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待"谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文