当前位置：文江博客话题详情

并行strlen？

发布于 2024-10-19 09:02:51 字数 91 浏览 7 评论 0原文

我想知道尝试编写 strlen 函数来并行查找 \0 序列是否有任何优点。如果是这样，这样的功能应该考虑什么？谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

心碎无痕… 2024-10-26 09:02:51

strlen() 本质上是顺序的 - 超出空终止符的一步是未定义的行为，并且空终止符可以在任何位置 - 第一个字符或第一个字符，因此您必须按顺序扫描。

回复收藏 0 原文

昔梦 2024-10-26 09:02:51

您必须确保线程找到的 NUL 是字符串中的第一个 NUL，这意味着线程需要在其最低 >NUL 位置是。因此，虽然可以做到，但同步的开销将比并行化带来的任何潜在收益要昂贵得多。

另外，还有缓存的问题。单个线程可以连续读取字符串，这是缓存友好的。多个线程存在互相踩踏的风险。

回复收藏 0 原文

情话难免假 2024-10-26 09:02:51

在某些并行架构上这是可能的，但前提是可以保证可以安全地访问字符串之外的大量内存；仅当字符串预计相当长且线程通信和同步成本较低时，它才实用。例如，如果有 16 个处理器，并且知道可以安全地访问字符串末尾以外的 256KB，则可以首先分派 16 个处理器来处理 16 个 4K 块。每次处理器完成并且没有找到零时，它可以开始处理下一个 4K 块（如果它位于仍在处理的最低块的 256KB 范围内），或者等待最低处理器完成。在实践中，除非字符串真的很大，否则同步延迟和过多的工作将无法从并行性中获得任何收益，但如果需要找到多兆字节字符串的长度，则可以并行完成该任务。

回复收藏 0 原文

晨光如昨 2024-10-26 09:02:51

要并行化任务，您必须拆分输入数据并将其分派到多个线程。如果事先不知道字符串的长度，则无法拆分数据。

所以你必须提前知道输入数据的分配大小（不一定与字符串长度相同），然后它才能工作。

您的程序可能会返回可能已找到的多个 NUL 值。仅当处理已找到的任何 NUL 值之前的数据的所有线程都已完成时，您的函数才能知道已找到正确的 NUL 值。

假设我们将字符串分成 8 个块 (0-7)。如果我们在块 3 中发现 NUL 值，我们无法知道块 0-2 中是否还有其他 NUL 值，因此我们必须等待这些线程中的任何一个，这样我们就可以立即停止所有其他线程。如果在线程 1 中找到 NUL 值，我们只需等待线程 0 完成，这样我们就可以获得明确的答案。

回复收藏 0 原文