thrust

thrust

文章 0 浏览 5

对用户定义结构的 Thrust::device_vector 执行独占扫描。编译错误

我正在修改 CUDA 提供的 Thrust 库。我试图对用户定义的结构的设备向量执行包含和独占扫描。这是代码。 #include #include #include #include #includ…

开始看清了 2024-12-23 02:45:47 5 0

Thrust/cudpp 中查找第 k 个最小元素的算法

我正在 Thrust/cudapp 中寻找第 k 个最小元素算法的实现。我用谷歌搜索但似乎没有找到。有谁知道是否存在这样的算法? 我看到有重新排序,但没有说第 …

望喜 2024-12-22 20:31:07 3 0

快速处理交错数据

在推力中处理交错数据的最佳方法是什么,假设我想添加交错长度等于 3 的值,例如: [1, 2, 3, 4, 5, 6] 将给出 [6, 15] 或解交错数据,所以 [1, 2, 3,…

穿透光 2024-12-21 00:21:08 4 0

CUDA Stream 压缩:理解概念

我正在使用 CUDA/Thrust/CUDPP。据我了解,在流压缩中,数组中的某些项目被标记为无效,然后“删除”。 那么“移除”到底是什么意思呢?假设原始数组 …

静谧幽蓝 2024-12-19 17:52:30 2 0

使用 CUDA Thrust 同时对多个数组进行排序

我需要按相同的键对 GPU 上已有的 20+ 数组进行排序,每个数组的长度相同。我不能直接使用 sort_by_key() 因为它也会对键进行排序(使它们无法对下一…

失与倦" 2024-12-18 05:10:39 3 0

具有 Cuda Thrust 的多个 GPU?

如何将 Thrust 与多个 GPU 一起使用? 这只是使用 cudaSetDevice(deviceId) 的问题吗 然后运行相关的Thrust代码?…

白龙吟 2024-12-18 02:19:50 2 0

你会如何在 CUDA 中实现这个功能? (排序整数向量中的偏移量)

我的设备上有一个排序的整数数组,例如: [0,0,0,1,1,2,2] 我想要另一个数组中每个元素的偏移量:( [0,3,5] 因为第一个 0 位于位置 0,第一个 1 位于…

堇色安年 2024-12-16 13:32:24 6 0

使用 Thrust 时在 CUDA 中启动计时内核

CUDA 中的内核启动通常是异步的,这(据我所知)意味着一旦 CUDA 内核启动,控制权立即返回到 CPU。当 GPU 忙于数字运算时,CPU 继续做一些有用的工作…

∞觅青森が 2024-12-14 21:53:21 1 0

Clock_gettime() CUDA 的计时问题

我想编写一个 CUDA 代码,在那里我可以直接看到 CUDA 在加速应用程序方面所带来的好处。 这是我使用 Thrust 编写的 CUDA 代码 ( http://code.google.c…

风吹雨成花 2024-12-14 17:34:30 2 0

是否存在一些 Thrust::device_vector 等效库,可以在 CUDA 内核中使用?

Throw::device_vector 的自动内存管理确实很有用,唯一的缺点是无法在内核代码中使用它。 我在互联网上查找,刚刚找到了矢量库,例如推力,它处理来自…

云裳 2024-12-14 02:55:23 2 0

在推力矢量类型上创建常规 CUDA 内核

我有一个简单的问题,例如,如果我想使用我在推力矢量上编写的 cuda 内核,我必须将我的 device_vector 转换为常规指针类型吗?或者还有其他方法吗? …

宛菡 2024-12-14 02:25:43 2 0

推力设备迭代器不工作

我不知道为什么下面的代码不输出 1,2 而是一些随机数 #include #include #include int main() { int a[]= { 1,2,3,4,5,6}; int b[] = {1,2,8}; int *g…

〆一缕阳光ご 2024-12-12 02:06:26 5 0

使用 CUDA Thrust 查找最大元素值及其位置

如何不仅获取值,还获取最大(最小)元素(res.val 和 res.pos)的位置? thrust::host_vector h_vec(100); thrust::generate(h_vec.begin(), h_vec.e…

蒲公英的约定 2024-12-08 20:47:09 4 0

从 Thrust::device_vector 到原始指针并返回?

我了解如何从向量转换为原始指针,但我跳过了如何向后转换的节拍。 // our host vector thrust::host_vector hVec; // pretend we put data in it her…

谁对谁错谁最难过 2024-12-08 10:46:37 2 0

将数据从设备复制到主机不起作用

我在 Windows 7 x64 上使用 vs2010,并在我的大学项目中使用 CUDA 工具包 v4.0。我想实现一个简单的 gpu-vs-cpu 测试,大部分已经完成,但我的 cuda …

杀お生予夺 2024-12-07 15:51:05 2 0
更多

推荐作者

梦途

文章 0 评论 0

蓝眼睛不忧郁

文章 0 评论 0

134fengkuang

文章 0 评论 0

yang18

文章 0 评论 0

属性

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文