当前位置：文江博客话题详情

测量进程消耗的 CPU 时钟

发布于 2024-08-27 21:16:09 字数 76 浏览 17 评论 0原文

我用 C 语言编写了一个程序。它是作为研究结果创建的程序。我想计算程序消耗的确切 CPU 周期。精确的循环次数。知道我怎样才能找到它吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你在我安 2024-09-03 21:16:09

valgrind 工具 cachegrind (valgrind --tool=cachegrind) 将为您提供详细的输出，包括执行的指令数、缓存未命中和分支预测失误。这些可以归结为汇编程序的各个行，因此原则上（了解您的确切架构）您可以从此输出中得出精确的周期计数。

要知道，由于缓存效应，它会在执行之间发生变化。

cachegrind 工具的文档位于此处。

回复收藏 0 原文

小草泠泠 2024-09-03 21:16:09

不，你不能。 “CPU 周期”的概念没有明确定义。现代芯片可以以多种时钟速率运行，并且它们的不同部分可以在不同时间执行不同的操作。

在某些情况下，“总共有多少管道步骤”的问题可能是有意义的，但不太可能有办法得到它。

回复收藏 0 原文

要走就滚别墨迹 2024-09-03 21:16:09

抱歉，但是不，至少对于大多数实际目的来说不是——对于大多数普通操作系统来说这是不可能的。举例来说，相当多的操作系统不会执行完整的上下文切换来处理中断，因此服务中断所花费的时间可能而且经常会表现为中断发生时正在执行的任何进程所花费的时间。

“不用于实际目的”将表明在周期精确模拟器下运行您的程序的可能性。这些是可用的，但主要用于主要用于实时嵌入式系统的 CPU，而不是用于像成熟的 PC 这样的东西。更糟糕的是，它们（通常）不是用于运行诸如成熟操作系统之类的东西，而是用于在“裸机”上运行的代码。

从理论上讲，您也许可以使用运行 Windows 或 Linux 之类的虚拟机做一些事情，但我不知道有任何现有虚拟机尝试这样做，而且这绝对不是微不足道的，而且可能有相当严重的问题。也会对性能产生影响（温和地说）。

回复收藏 0 原文

仅此而已 2024-09-03 21:16:09

尝试OProfile。它使用 CPU 上的各种硬件计数器来测量执行的指令数以及已经经过的周期数。您可以在文章内存第 7 部分：内存性能工具中查看其使用示例。

回复收藏 0 原文

菊凝晚露 2024-09-03 21:16:09

我不完全确定我确切知道您要做什么，但是在现代 x86 处理器上可以做的是阅读您感兴趣的代码块之前和之后的时间戳计数器 (TSC)。在汇编级别，这是使用 RDTSC 指令完成的，该指令为您提供 edx:eax 寄存器对中 TSC 的值。

但请注意，此方法有一些注意事项，例如，如果您的进程在 CPU0 上开始并在 CPU1 上结束，则从 RDTSC 获得的结果将引用执行该指令的特定处理器内核，并且因此可能不具有可比性。（RDTSC 还缺乏指令序列化，但在这种情况下，我认为这不是一个大问题。）

回复收藏 0 原文

~没有更多了~

关于作者

您的好友蓝忘机已上羡

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

测量进程消耗的 CPU 时钟

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

测量进程消耗的 CPU 时钟

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。