使用 callgrind 作为采样分析器？

发布于 2024-09-18 08:33:15 字数 513 浏览 15 评论 0原文

我一直在寻找 Linux 采样分析器，callgrind 已经出现了最接近显示有用的结果。然而，开销估计比正常情况慢 20--100 倍。此外，我只对每个函数花费的时间感兴趣（特别强调阻塞调用，例如 read() 和 write()，其他分析器都不会忠实地显示这些调用）。

有没有办法关闭多余的选项，以便只记录最少的数据来生成各种调用堆栈中花费的时间？
callgrind 的 Cachegrind 传统是否意味着在缓存分析等方面做了过多的工作？
我认为 callgrind 的操作就像一个调试器。是否可以调整以每隔一段时间而不是每条指令对过程进行采样？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

寂寞笑我太脆弱 2024-09-25 08:33:15

3) Callgrind 的工作方式类似于动态翻译器，它用计数仪器代码来检测原始代码。对代码中的每个内存访问指令（用于缓存模拟）以及（我建议）每个类似 jmp 的指令进行检测以跟踪 exec。每个基本块的计数。

我有一个小型采样分析器，它的作用就像调试器一样；它确实将 setitimer() 分析计数器注入到应用程序中，然后拦截所有 SIGALRM 并打印当前的 $eip 值。

之前有一些使用 setitimer 方法的采样分析器，还有一个 profil()之类的东西。这是由 glibc/gmon/gmon.c 和 gprof -p 使用的（确切地说，是由 gcc -pg）使用的。 profil() 函数能够通过每 1 或 10 毫秒采样一次虚拟 CPU 时间来分析单个连续代码片段。还有 sprofil() 函数。

另请检查 LD_PRELOAD=/lib/libpcprofile.so PCPROFILE_OUTPUT=output.file - 但我不知道它是否工作或如何工作

对于编号问题：

2）“Callgrind 是 Cachegrind 的扩展。它提供了 Cachegrind 的所有信息确实如此，再加上有关书法的额外信息。” - 因此它可以提供cachegrind中的任何内容，而且还允许用户关闭缓存模拟：--simulate-cache=no（这是默认值）

对于速度：根据< a href="http://www.valgrind.org/docs/manual/nl-manual.html" rel="nofollow">http://www.valgrind.org/docs/manual/nl-manual.html< /a> - Nul valgrind 工具（又名 nulgrind）的手册，它没有额外的仪器，速度减慢了 5 倍。这是因为程序是由 valgrind 本身动态翻译的。所以，valgrind 不可能有比 nulgrind 更快的工具。