当前位置：文江博客话题详情

通过生成中间阶段执行大型 C 程序

发布于 2024-12-27 16:27:49 字数 244 浏览 0 评论 0原文

我有一个需要 7 天才能运行完成的算法（还有更多算法）

问题：为了成功运行该程序，我需要持续供电。如果运气不好，中间断电了，我需要重新启动。

所以我想问一种方法，可以让我的程序分阶段执行（假设每个阶段生成结果 A、B、C...），现在如果断电，我可以如何使用这个中间结果并从该点继续/恢复运行。

问题 2：如何防止每次循环迭代时重新打开文件（ fopen 被放置在运行近一百万次的循环中，这是需要的，因为每次迭代都会更改文件）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

清音悠歌 2025-01-03 16:27:49

你可以将它分离到一些源文件中，然后使用make。

回复收藏 0 原文

似梦非梦 2025-01-03 16:27:49

当每个结果阶段完成时，分支到一个新的宇宙。如果新宇宙的力量失效了，摧毁它并回到你分支的时间点。重复直到所有阶段完成，然后通过先验虫洞将结果合并到原始宇宙中。

回复收藏 0 原文

雪花飘飘的天空 2025-01-03 16:27:49

好吧，我猜有几个选项：

您沿着合理的路线分割算法，其中一个阶段的定义输出可以作为下一阶段的输入。然后，将您的算法配置为工作流程（最好通过某个声明文件进行软配置。
您向算法添加逻辑，通过该逻辑它知道它已成功完成（提交）的内容。然后，在失败时，您可以重新启动算法并将其分类所有未提交的数据并从最后一个提交点重新启动

请注意，这两个选项可能会进一步延长您的 7 小时运行时间！

因此，为了提高整体运行时间，您是否也可以分离您的算法，以便它具有可以工作的“工作”组件。关于“工作”这通常意味着绘制一些可以参数化的“愚蠢”但密集的逻辑（例如计算），然后，您可以选择在网格/空间/云/任何东西上运行您的算法。甚至不需要是一个空格...只需使用队列（IBM MQ 系列有一个 C 接口），并让其他机器上的侦听器侦听您的作业队列并在保存结果之前处理您的结果。您仍然可以按照上面讨论的方式对算法进行阶段化。

回复收藏 0 原文

韬韬不绝 2025-01-03 16:27:49

问题 2：在循环的每次迭代中打开文件，因为它已更改

我可能不是最有资格回答这个问题，但在每次迭代时执行 fopen （以及 fclose）大概看起来既浪费又缓慢。为了回答，或者有更合格的答案，我认为我们需要更多地了解您的数据。

例如：

它是文本还是二进制？
您正在处理记录还是文本流？也就是说，它是一个记录文件还是一个数据流？（你不是在破解基因吗？:-)

我问，根据你的评论“因为它每次迭代都会改变”，你最好使用随机访问文件。由此，我猜测您正在重新打开 fseek 到您可能已经通过的点（在数据流中）并进行更改。但是，如果您以二进制方式打开文件，则可以使用 fsetpos 和 fseek 在文件中的任何位置进行 fseek。也就是说，你可以向后“寻找”。

此外，如果您的数据是基于记录的或以某种方式组织的，您还可以为其创建索引。有了这个，您可以使用 fsetpos 将指针设置在您感兴趣的索引处并进行遍历。因此，节省了查找要更改的数据区域的时间。您甚至可以将索引保留在随附的索引文件中。

请注意，您可以将纯文本写入二进制文件。也许值得调查？

回复收藏 0 原文

盗琴音 2025-01-03 16:27:49

对我来说听起来像是经典的批处理问题。
您需要在应用程序中定义检查点并存储中间数据，直到到达检查点。
检查点可以是数据库中的行号，也可以是文件中的位置。
您的处理时间可能比现在更长，但会更可靠。
一般来说，您应该考虑算法中的瓶颈。
对于问题 2，您必须使用两个文件，如果您调用 fopen 的次数减少 100 万次，您的应用程序可能会快几天......