解析 Webalizer 或/和 AWstats html 文件
我有带有几个子域的 CPanel 托管。每个人都使用 AWstats 跟踪自己的统计数据。
有没有办法解析生成的 HTML 表以获取所使用的带宽?
谢谢大家。
I've got CPanel hosting with a few subdomains. Each one tracks its own stats using AWstats.
Is there any way to parse the HTML tables that are generated to get the bandwidth used?
Thanks for all.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
直接读取 HTML 的另一种方法是直接使用 awstats 用于呈现 HTML 的统计文件。 cpanel 应该将它们存储在可访问的地方(在我的主机上,它们位于 tmp/ 中)。这是一个简单的文本文件,具有易于找到的标记清晰的部分,并且在该部分内是表示表格的空格分隔的 CSV。这个关于用 PHP 解析文件的页面是获取以下信息的好地方如何用代码做到这一点。我确信,只要掌握一点 Linux 知识,您就可以使用 sed 和 awk 分别剪切文件并返回从这些摘要中收集所需统计信息所需的列。
An alternative to reading the HTML directly is to directly use the stats files that awstats uses to render the HTML. cpanel should store them somewhere accessible (on my hosting they're in tmp/). It's a simple text file, with well marked sections that are easily found, and within the section is space-separated CSV representing the tables. This page on parsing the files with PHP is a good place for information on how to do it with code. I'm sure with a bit of linux know-how you can use sed and awk to respectively chop the file and return the columns you need to gather up the stats you need from these summaries.
使用 DOMXPath 查询获取“kB F”中每一行的文本列,例如第一行的以下内容:
参考
Simpletons 指南网络服务器日志分析
Webalizer 常见问题解答
Use a DOMXPath query the get the text of each row in the "kB F" column, such as the following for the first row:
References
Simpletons Guide to Web Server Log Analysis
Webalizer FAQ