关于提取web日志中错误代码行的一个问题,求助!

发布于 2022-10-15 08:37:45 字数 1615 浏览 22 评论 0

有一个问题想请教一下,若各位大虾有时间麻烦指点一下,我awk和sed比较弱,所以学习大家了。
问题:
HTTP访问日志中一般大于400的代码都是错误代码,因此想通过提取错误代码所在行来进行一些分析。
假设日志名为20110425.log,首先我使用#sed -n '/[4-5][0-9][0-9]/p' 20110425.log > /tmp/test,得到了以下test文件,我截取具有典型性的来给大家看:

127.0.0.1 - - [25/Apr/2011:09:33:48 +0800] "GET /images1/flashimg/shop_flash1.gif HTTP/1.1" 304 - "http://www.123.cn/shop.do" "Mozilla/4.0 (compatible; MSIE 7.0; Windows
NT 5.1; .NET CLR 2.0.50727; InfoPath.2; Maxthon 2.0)"
127.0.0.1 - - [25/Apr/2011:09:33:48 +0800] "GET /css/img/mainLbg_m.gif HTTP/1.1" 200 92 "http://www.123.cn/shop.do" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .N
ET CLR 2.0.50727; InfoPath.2; Maxthon 2.0)"
127.0.0.1 - - [25/Apr/2011:09:33:48 +0800] "GET /images_old/shousuo.gif HTTP/1.1" 404 1021 "http://www.123.cn/shop.do" "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1;
.NET CLR 2.0.50727; InfoPath.2; Maxthon 2.0)"
127.0.0.1 - - [25/Apr/2011:14:01:46 +0800] "GET /loading2.gif HTTP/1.1" 500 991 "http://www.123.cn/shop_categorylist.do?categoryId=333" "Mozilla/4.0 (compatible; MSIE 8.0
; Windows NT 5.1; Trident/4.0; .NET CLR 2.0.50727)"

其实,众所周知,真正错误或正确代码是上面 绿色标记字体;而因为上面 红色标记字体 影响,导致了,我的test文件中把正确代码所在行也输出了出来。

所以,我的问题就是请教高手提供一些帮助,其实我真正想得到的是404,405,406........等等错误代码的所在行。

谢谢各位!

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

卷耳 2022-10-22 08:37:45

awk '$8 > 400 {print $0}' urfile

段念尘 2022-10-22 08:37:45

awk '$8 > 400 {print $0}' urfile
CMAX 发表于 2011-04-25 17:51

问题解决,谢谢你了!

结贴···谢谢大家。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文