基准测试注意事项和确定性数据收集

发布于 2024-11-24 04:31:50 字数 466 浏览 1 评论 0原文

我正在编写一个 C++ 基准测试程序，其中涉及对许多函数调用进行计时。函数会被重复调用，每次都会被记录下来，以便以后进行统计分析。要求函数在多个线程上同时运行，因此为了保证基准测试的准确性和公平性，它在实时操作系统上运行，并控制调度行为。以下是我的担忧：

是否有确定的方法来收集计时数据？我看过 printf 和 stringstream，但由于内存和字符串流，似乎都没有确定性行为。缓冲操作。出于同样的原因，它们也不会在 O(1) 中执行，我是对的吗？目前我正在使用一个大型字符数组和一个自定义 strcat 函数，以便可以在 O(1) 内收集每个时间值。然后在测试结束时收集所有数据后打印该数组。

我使用 clock_gettime 进行计时，clock_getres 为我提供了 1ns 的分辨率。这个值可信吗？

到目前为止，我做的事情是否正确？在编写基准测试时是否还应该注意其他问题？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

乜一 2024-12-01 04:31:50

调用高频定时器并将样本写入输出流是获取性能数据的完全明智的方法。但有一些棘手的问题需要小心。

事实上，您不应该使用 printf 和 stringstream - 不仅因为它们的执行时间是可变的且定义不明确，而且还因为它们非常慢，特别是如果您每微秒将性能数据格式化为字符串！最好将二进制数据写入预先分配的缓冲区（例如结构数组），然后在测试完成后对其进行格式化。这会更快并且给你带来更一致的写入开销。
如果编写内核的人不是傻瓜，那么具有高分辨率计时器（例如CLOCK_PROCESS_CPUTIME_ID）的clock_gettime应该是可靠的。如果您想查询CPU，您可以查看性能应用程序编程接口库直接计时器，但这不是必需的。
多线程本质上可能是混乱的（在确定性意义上），因为线程会相互争夺 CPU 缓存和内存带宽。您可以获得随机变化的结果，具体取决于同时调度的线程是否碰巧接触相同的内存，或者始终从数据缓存中逐出彼此的工作 - 并且这会因运行而异，具体取决于数据的放置方式内存中的资源以及哪些线程正在运行。但这没关系：工程中的许多过程都是随机的。只需多次运行基准测试，即可获得具有统计意义的性能数据平均值和偏差。

或者，如果您确实需要 100% 的确定性，则需要确保您的线程以相同的顺序进行调度，运行相同的量子，并将每次运行的数据放入相同的内存地址中。

回复收藏 0 原文

清风疏影 2024-12-01 04:31:50

出于实际性能考虑，不要使用大 O 表示法。

也就是说，对于问题的其余部分：

性能收集将需要一些时间（O(1) 仍然是有意义的时间，只是它不依赖于您的数据）。您需要使其最有效。

这意味着：

不要使用 printf 等，而是写入特殊的内存区域，稍后您将从中提取数据。
出于同样的原因，不要使用 strcat，而是使用二进制数据的 struct。完成后最后解析它。
不要测量每个呼叫，而是考虑测量平均值（即：测量不是每个呼叫，而是每个 1000 个呼叫，并取平均值以提取单个呼叫的大致成本）。这将使您的测量开销倍数减少。虽然这种可能性并不总是存在，但请考虑一下。
clock_gettime 通常是可信的，但这取决于您的操作系统和硬件 - 检查一下，有时硬件时钟分辨率可能不会像您希望的那么小。