如何按时间聚合日志记录

发布于 2024-12-13 11:35:13 字数 77 浏览 3 评论 0原文

我有一个巨大的日志文件,其中包含以时间戳为前缀的日志消息。时间戳的精度为微秒。我想找到记录最多消息数的 10 秒时间窗口。你怎么能这么做呢?

I have a huge log file containing log messages prefixed with timestamp. The timestamp is with the precision of microseconds. I want to find a 10 sec time window when highest number of messages were logged. How can you do that?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

瞳孔里扚悲伤 2024-12-20 11:35:13

您需要逐行读取文件,找出每个时间戳所在的 10 秒周期,并跟踪哪个时间戳范围具有最大的“成员”计数。

您没有指定哪种语言,所以我只使用伪代码:

  1. 读取一行
  2. 提取/将时间戳转换为 10 秒间隔数字,
  3. 如果此时间戳超出前一个间隔的范围,“记住”该间隔的
    成员计数并启动新的间隔计数器
  4. 如果前一个间隔的成员计数大于最后记录的最大间隔,则使前一个间隔成为新的“最大”间隔
  5. 增加此新行的间隔计数器。
  6. 重复直到文件被消耗
  7. 掉记录的间隔数,该数将具有最大的成员数

You'd need to slurp in the file line by line, figure out which 10s period each timestamp is in, and keep track of which timestamp range had the biggest "member" count.

You don't specify which language, so I'll just use pseudocode:

  1. read a line
  2. extract/convert timestamp to a 10s interval number
  3. if this timestamp is outside the range of the previous interval, "remember" that interval's
    membership count and start a new interval counter
  4. If the previous interval's membership count is bigger than the last recorded biggest interval, make the previous interval be the new "biggest" interval
  5. Increment interval counter for this new line.
  6. repeat until file's been consumed
  7. spit out the recorded interval number, which will have had the biggest membership count
萌酱 2024-12-20 11:35:13

您可以首先将日志文件聚合为一秒的间隔,然后在这些数字中找到最高权重的序列。

You might first aggregate your log files into one second intervals, then find in these numbers the sequence of highest weight.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文