使用 Cuda 并行读取多个文本文件

发布于 2024-12-28 14:02:56 字数 401 浏览 1 评论 0原文

我想使用 CUDA 在多个文件中并行搜索给定字符串。我计划使用 pfac 库来搜索给定的字符串。问题是如何并行访问多个文件。

示例：我们有一个包含 1000 个文件的文件夹，需要搜索。

这里的问题是我应该如何访问给定文件夹中的多个文件。应该动态获取文件夹中的文件，并且应该为每个线程分配一个文件来搜索给定的字符串。

是否可以？？？？

编辑：

在这篇文章中：非常快的文本文件处理（C++）。He正在使用 boost 库在 16 秒内读取 3 GB 文本文件。而就我而言，我必须读取 1000 个较小的文件，

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

感受沵的脚步 2025-01-04 14:02:56

在 CUDA 中完成任务并不会比在 CPU 中完成同样的任务有多大帮助。

假设您的文件存储在标准的磁性 HDD 上，典型的单线程 CPU 程序将消耗：

大约 5 毫秒找到存储文件的扇区并将其放在读头下方。
将 1MB 文件（假设读取速度为 100MB/s）加载到 RAM 内存中大约需要 10 毫秒
。将 1MB 数据从 RAM 加载到 CPU 缓存并使用线性搜索算法对其进行处理的时间不到 0.1 毫秒。

对于单个文件来说，即 15.1 毫秒。如果您有 1000 个文件，则需要 15.1 秒才能完成该工作。

现在，如果我给你一个超级强大的 GPU，具有无限的内存带宽、无延迟和无限的处理器速度，你将能够立即执行任务 (3)。然而，HDD 读取仍然会消耗完全相同的时间。 GPU 无法并行另一个独立设备的工作。
因此，您现在只需 15.0 秒即可完成，而不是花费 15.1 秒。

无限 GPU 将为您带来 0.6% 的加速。真正的 GPU 根本无法接近这个数字！

在更一般的情况下：如果您考虑使用 CUDA，请问自己：实际计算是问题的瓶颈吗？

如果是 - 继续在 CUDA 世界中寻找可能的解决方案。
如果没有 - CUDA 无法帮助您。

如果您处理数千个小文件并且需要经常执行读取，请考虑可以“攻击”瓶颈的技术。其中可能包括：

RAM 缓冲
将硬盘驱动器置于 RAID 配置中
获取 SSD

可能有更多选择，我不是该领域的专家。

回复收藏 0 原文

撩发小公举 2025-01-04 14:02:56

是的，如果您可以减少读取延迟/带宽的影响，那么使用 CUDA 可能会获得加速。一种方法是同时执行多个搜索。即，如果您可以在大干草堆中搜索 [needle1], .. [needle1000]，那么每个线程都可以搜索干草堆碎片并存储命中。需要对每次比较所需的吞吐量进行一些分析，以确定是否可以通过使用 CUDA 来改进您的搜索。这可能有用 http://dl.acm.org/itation.cfm?id= 1855600

回复收藏 0 原文

~没有更多了~