一种估计程序运行时间的算法

发布于 2024-07-26 11:50:55 字数 315 浏览 10 评论 0原文

我需要找到程序在不同输入上执行的总时间。该程序读取一些数据并将其写入另一个文件。数据值的值和数据的大小每次都不同。

我想知道所有大小的数据通常需要多长时间。

找到这个的算法是基于程序单次执行的总时间吗？

例如，如果我知道，

for single execution 
a.program - execution time   1.2sec 
          - its create file  100 kb file

我能否找出不同数据大小下 n 次执行需要多长时间？

原文

I need to find the total timings for the execution of a program over different inputs. The program reads some data and writes it into another file. The values of the data value and the size of the data are different every time.

I want to find how long it will take in general for all size of data.

Is the algorithm for finding this based on the total timings of the program for a single execution?

For Example, if I know

for single execution 
a.program - execution time   1.2sec 
          - its create file  100 kb file

Can I find out how long it will take for n executions, on a different data size?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

掐死时间 2024-08-02 11:50:56

计算机科学有一整个分支致力于此：算法复杂性。简而言之，您可以分析代码以确定其具有哪些性能特征，例如，大多数好的排序算法的平均运行时间为 O(n log n)，其中 n 是要排序的数组的大小。这意味着对 100 项进行排序的时间长度为 100 * ln 100 / ln 2 * x 或 664x，其中 x 是运行一条指令所需的时间量。

回复收藏 0 原文

遇见了你 2024-08-02 11:50:56

从问题来看，我不确定您是在运行该程序之前尝试计算执行时间，还是记录脚本运行所需的时间。如果您试图预先计算，我同意其他答案，认为这是不可能的。

如果您想记录执行时间，只需在程序中添加 2 个全局日期变量，在执行开始时立即将当前日期和时间存储在一个变量中，然后在终止时将时间存储在第二个变量中。使用日期差函数可以得到经过的秒数（或所需的时间单位）。

回复收藏 0 原文

待＂谢繁草 2024-08-02 11:50:56

很难确定，但我不认为这是停止问题的一个版本。（或者，至少，它可以被简化，这样就不是）。

我认为，您只是要求估计一系列读取和写入将花费多长时间......但读取和写入的量不同。

最简单的方法是进行一些经验测量（越多越好），并使用这些测量来估计未来运行需要多长时间。如果您发现读取 10 MB 的数据需要 10 秒，那么您可以估计读取 100 MB 的数据可能需要大约 100 秒。（当然，这假设您正在查看 O(n) 算法...如果不是，您将必须进行相应调整。）

当然，这很容易出错，因为其他原因系统上正在进行...但是，根据您的需要，它可能会为您提供足够好的估计。

当然，如果您能够在阅读/写作时更新您的估计，您就可以改进它们。

回复收藏 0 原文

恏ㄋ傷疤忘ㄋ疼 2024-08-02 11:50:56

如果您询问实际的解决方案，请使用基准模块或其他记录时间的过程。然后针对多个输入的输入大小绘制执行时间并进行插值（但要注意外推，如该 xkcd 卡通所示< /a>）。

如果您想了解该理论，您需要了解“计算复杂性”，这是一个很好的知识搜索术语帮助您入门。

例如，如果您运行一次数据，那么通常两倍的数据将花费大约两倍的时间。最好的搜索算法通常需要 O(NlnN)，因此两倍的数据将花费略多于两倍的时间。但即使这些也只能限制时间长度，并且常数将取决于磁盘访问、内存、运行的其他程序等。

回复收藏 0 原文

月亮是我掰弯的 2024-08-02 11:50:56

您必须知道您的程序是否停止。它不能自动被需要，但您可以确定您是否了解其设计。那么你至少要知道你的程序的渐近复杂度。如果您知道真正的复杂性公式，那就更好了。然后您可以对足够的输入集进行基准测试。然后您可以对数据进行插值以获得常量。最后只需将常数代入方程并计算即可。很容易，不是吗？ ;-)

回复收藏 0 原文

星光不落少年眉 2024-08-02 11:50:56

如果你可以重新执行你的程序。你可以使用unix“time”命令来计时。如果没有，您需要保存系统时间，然后在程序结束时再次保存并将其打印出来？

回复收藏 0 原文

久夏青 2024-08-02 11:50:55

我不太明白你的问题，但我相信你要问的是如何在运行程序之前计算出程序的执行时间。

这与停止问题有关。停机问题很棘手。

如果我误解了你的问题，我深表歉意。

编辑：为了回应您的澄清，对于外推运行时以获取更大的输入，没有通用算法较小输入的运行时间。算法分析是一件非常棘手的事情。您可以使用一些启发式方法。例如，您可以计算不同“大小”（例如 10、100、1000、10000）的输入的运行时间，并尝试将曲线拟合到函数“大小”-> 运行。

回复收藏 0 原文

九局 2024-08-02 11:50:55

对此没有完美的算法，并且变化很大 - 第一次运行可能非常慢，但第二次运行会快得多，因为磁盘中的数据缓存在内存中。

您可以使用各种输入来测量程序，并尝试构建输入大小/复杂性与执行时间相比的模型，然后使用该结果来估计执行时间。

回复收藏 0 原文

只有一腔孤勇 2024-08-02 11:50:55

如果我理解正确的话，您想了解一个进程执行需要多长时间。

如果是这种情况，请使用 Benchmark 模块。

使用它，您可以在不同的地方进行计时并判断程序不同部分的计时。

回复收藏 0 原文

無處可尋 2024-08-02 11:50:55

1、停机问题是棘手的，即即使你有数据和程序，也无法告诉（！在一般情况下！）运行它需要多长时间。
2、停机问题中的“程序”指的是完整的状态，例如你的程序+它处理的数据。

所以这是两次棘手的事情:)

回复收藏 0 原文

云归处 2024-08-02 11:50:55

如果您知道算法的渐近运行时间，例如知道排序算法是 n*log(n)，您可以在小输入上运行它并计算（尽管可能只是一个范围）对于较大输入的情况。问题是分析大多数算法都非常困难。否则，您可以在较小的输入上运行几次并执行某种类型的回归< /a> （可能是非线性的）发现/近似算法性能特征的方程，并使用它来计算更大的输入。

回复收藏 0 原文

~没有更多了~