当前位置：文江博客话题详情

Unix 中的日志解析器/分析器

发布于 2024-08-24 20:25:07 字数 108 浏览 8 评论 0原文

人们在 Unix 中使用什么流行工具来解析/分析日志文件？进行计数，找到唯一的，选择/复制具有特定模式的特定行。请推荐一些工具或一些关键字。因为我相信以前肯定有人问过类似的问题，但我不知道关键字。谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

海拔太高太耀眼 2024-08-31 20:25:07

我发现许多日志格式没有使用适当的唯一字段分隔符来分隔列，这是一个巨大的失败。不是因为这是最好的，而是因为它是 unix textutils 操作表数据的基本前提。相反，他们倾向于使用空格作为分隔符和可能包含空格的引用字段。

我对 Web 日志分析所做的最实用的简单更改之一是保留 nginx Web 服务器生成的默认 NCSA 日志格式，而是使用制表符作为字段分隔符。

突然之间，我可以使用所有原始的 unix textutils 进行快速查找，尤其是 awk！仅打印用户代理字段包含 Googlebot 的行：

awk 'BEGIN {FS="\t"}  $7 ~ /Googlebot/ { print; }' < logfile

查找每个唯一请求的请求数

awk 'BEGIN {FS="\t"}  { print $4; }' < logfile | sort | uniq -c | sort -n

，当然还有大量组合来查找特定访问者。

I find it to be a huge failure that many log formats do not separate columns with proper unique field separators. Not because that is best, but because it is the basic premise of unix textutils that operate on table data. Instead they tend to use spaces as separators and quote fields that might contain spaces.

One of the most practical simple changes I made to web log analyzing was to leave the default NCSA log format produced by the nginx web server, to instead use tab as the field separator.

Suddenly I could use all of the primitive unix textutils for quick lookups, but especially awk! Print only lines where the user-agent field contains Googlebot:

awk 'BEGIN {FS="\t"}  $7 ~ /Googlebot/ { print; }' < logfile

Find the number of requests on for each unique request

awk 'BEGIN {FS="\t"}  { print $4; }' < logfile | sort | uniq -c | sort -n

And of course lots of combinations to find specific visitors.

回复收藏 0 原文

深海夜未眠 2024-08-31 20:25:07

对于定期的夜间检查，有 logwatch，它在 /usr/share/logwatch 中有几个不同的脚本/scripts/services 检查 syslog 中的特定内容（例如 Web 服务器内容、ftp 服务器内容、sshd 相关内容等）。默认安装启用了其中的大多数功能，但您可以根据需要启用/禁用，甚至可以编写自己的脚本。

对于实时观看，有 multitail。

回复收藏 0 原文

伴梦长久 2024-08-31 20:25:07

您可能想尝试lnav，一个基于curses的日志分析器。它具有您期望从日志解析器获得的大部分功能，例如，来自多个日志文件的日志消息按时间顺序排列、支持多种日志格式、突出显示错误/警告消息、用于在错误/警告消息之间导航的热键、对 SQL 的支持查询以及更多。查看该项目的网站以获取屏幕截图和详细的功能列表。

回复收藏 0 原文