Apache 日志:按服务字节数计算前 10 个 URL
我有一个 Apache 日志格式文件。示例字符串:
fj5020.inktomisearch.com - - [01/Oct/2006:06:35:59 -0700] "GET /example/When/200x/2005/04/27/A380 HTTP/1.0" 200 4776 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
其中 4776 表示页面大小(以字节为单位)。我想按服务流量输出前 10 个 URL。我遇到了将每个唯一页面的所有大小相加的问题(页面的大小也可以是可变的)。有什么想法如何在 Bash 或/和 AWK 中做到这一点吗?
I have an Apache log format file. Example string:
fj5020.inktomisearch.com - - [01/Oct/2006:06:35:59 -0700] "GET /example/When/200x/2005/04/27/A380 HTTP/1.0" 200 4776 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"
where 4776 is served page size in bytes. I'd like to output top 10 URLs by served traffic. I'm stuck with the problem of summing all sizes of each unique page (the size of a page can also be variable). Any ideas how to do it in Bash or/and AWK?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
这对你有用吗?
does this work for you?
有很多方法可以做到。这是一个。
Lots of ways to do it. Here's one.