请求的 url 以什么格式写入网络服务器日志文件中?
我正在开发一个免费的网站站点地图应用程序。
我想问一下网络服务器日志文件中写入的请求网址的格式是什么?
我想解析这些日志文件以提取网站的各个页面。
每行的格式是否始终为“GET /mywebpage.html”? 谢谢 !
i am developing a free website sitemap application.
I would like to ask what is the format of the requested urls that are written in the webserver log files ?
I want to parse those log files in order to extract the various pages of the website.
Is the format always " GET /mywebpage.html " in each row ?
Thank you !
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
它并不总是相同的 - 默认值因服务器而异,并且是可配置的。例如,在 Apache 中,您可以在中设置 CustomLog 指令您的配置,允许完全自定义记录的信息、记录的顺序以及记录的文件。
It's not always the same - the default varies between servers, and it is configurable. For example, in Apache, you can set a CustomLog directive in your config and that allows complete customisation of the information that is logged, the order in which is it logged and the file it is logged to.
到目前为止,最常见的格式是 Apache CLF (通用日志格式或组合日志格式)日志格式):
要获得更好的答案,您需要指定正在使用的网络服务器,或者至少显示示例日志行。
By far the most common format is Apache CLF (Common Log Format or Combined Log Format):
To get a better answer you need to specify the webserver in use, or at the very least show a sample log line.