当前位置：文江博客话题详情

tbb：并行查找第一个元素

发布于 2024-12-09 09:17:48 字数 298 浏览 3 评论 0原文

我遇到了这个问题：

查找列表中满足给定条件的第一个元素。

不幸的是，该列表相当长（100.000 个元素），并且使用单个线程评估每个元素的条件总共需要大约 30 秒。

有没有办法干净地并行化这个问题？我浏览了所有tbb模式，但找不到任何合适的。

更新：出于性能原因，我想在找到项目时尽早停止并停止处理列表的其余部分。这就是为什么我相信我不能使用 parallel_while 或 parallel_do。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

无畏 2024-12-16 09:17:48

我对此不太熟悉，但只是想一想，你不能让一组线程从不同的起始点以相同的步幅进行不同的迭代吗？

假设您决定拥有 n 个线程（= 核心数或其他），每个线程都应指定一个最多 n 的特定起点，因此第一个线程从 < code>begin()，它比较的下一个项目是 begin() + n，等等。第二个线程从 begin()+1 开始，并且那么下一个比较也在 n 中这样

你就可以让一组线程并行地遍历列表，迭代本身可能并不昂贵 - 只是比较。没有节点会被比较多次，并且您可以在任何线程进行匹配时设置一些条件，并且所有线程都应该在迭代/比较之前检查此条件。

我认为实现起来非常简单（？）

回复收藏 0 原文

dawn曙光 2024-12-16 09:17:48

我认为用TBB解决这个问题的最好方法是parallel_pipeline。

管道中应该（至少）有两个阶段。第一阶段是串行的；它只是从列表中读取下一个元素并将其传递到第二阶段。该第二阶段是并行的；它评估给定元素的感兴趣条件。一旦满足条件，第二阶段就会设置一个标志（该标志应该是原子的或用锁保护）来指示找到解决方案。第一阶段必须检查此标志，并在找到解决方案后停止读取列表。

由于条件评估是对几个元素并行执行的，因此可能会出现找到的元素不是列表中第一个合适的元素。如果这很重要，您还需要保留元素的索引，当找到合适的解决方案时，您可以检测其索引是否小于先前已知的解决方案（如果有）的索引。

HTH。

回复收藏 0 原文

倚栏听风 2024-12-16 09:17:48

好的，我是这样做的：

将所有元素放入 tbb::concurrent_bounded_queue;元素。
创建一个空的 tbb::concurrent_vector;结果。
创建一个boost::thread_group，并创建几个运行此逻辑的线程：

并行运行的逻辑：

Element e;
while (results.empty() && elements.try_pop(e) {
    if (slow_and_painfull_check(e)) {
         results.push_back(e);
    }
}

因此，当找到第一个元素时，所有其他线程在下次检查时将停止处理>results.empty()。

有可能两个或多个线程正在处理 slow_and_painfull_check 返回 true 的元素，因此我只是将结果放入向量中并在并行循环之外处理它。

线程组中的所有线程完成后，我检查结果中的所有元素并使用第一个元素。

ok, I have done it this way:

Put all elements into a tbb::concurrent_bounded_queue<Element> elements.
Create an empty tbb::concurrent_vector<Element> results.
Create a boost::thread_group, and create several threads that run this logic:

logic to run in parallel:

Element e;
while (results.empty() && elements.try_pop(e) {
    if (slow_and_painfull_check(e)) {
         results.push_back(e);
    }
}

So when the first element is found, all other threads will stop processing the next time they check results.empty().

It is possible that two or more threads are working on an element for which slow_and_painfull_check returns true, so I just put the result into a vector and deal with this outside of the parallel loop.

After all threads in the thread group have finished, I check all elements in the results and use the one that comes first.

回复收藏 0 原文

×纯※雪 2024-12-16 09:17:48

你可以看看 http://gcc.gnu.org/onlinedocs/libstdc++ /manual/parallel_mode.html 用于并行算法实现。
特别是你需要 find_if 算法 http://www.cplusplus.com/reference/algorithm/find_if /

回复收藏 0 原文

带刺的爱情 2024-12-16 09:17:48

我在这里看到了两种并行机会：在多个线程上评估一个元素，或者在不同线程上一次评估多个元素。

没有足够的信息来确定在多个线程上评估一个元素的难度和有效性。如果这很容易，每个元素的 30 秒时间就可以减少。

我认为 TBB 没有完全适合这个问题。列表没有随机访问迭代器、确定何时停止并保证找到第一个元素存在问题。不过，您可能可以玩一些游戏来使其发挥作用。

您也可以使用一些较低级别的线程构造来自己实现这一点，但有很多地方会返回错误的结果。为了防止此类错误，我建议使用现有算法。您可以将列表转换为数组（或具有随机访问迭代器的其他结构），并使用 user383522 引用的实验性 libstdc++ 并行模式 find_if 算法。

回复收藏 0 原文

我恋#小黄人 2024-12-16 09:17:48

如果它是一个链接列表，并行搜索不会增加太多速度。然而，链表在缓存中往往表现不佳。如果您有两个线程，您可能会获得微小的性能提升：一个线程执行 find_first_element，另一个线程只是迭代列表，确保在第一个线程之前获得的数据不会超过 X（100？）。第二个线程不进行任何比较，但将确保第一个线程尽可能好地缓存项目。这可能会帮助你节省时间，或者可能没什么作用，或者可能会造成阻碍。测试一切。

回复收藏 0 原文