怎么统计web服务器下的URL列表,判断其中链接数的更新情况?

发布于 2022-08-28 11:36:47 字数 96 浏览 7 评论 0

由于项目需要,需要去统计指定网络范围(如sina)下所有URL,并统计其各个web服务器下的URL列表,判断其中链接数的更新状况,估算每个URL源的更新周期。(本地没有缓存)

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

尾戒 2022-09-04 11:36:47

向服务器请求的时候header带上If-Modified-Since,问服务器有没有更新,如果更新了就返回文件,没有的话会返回304(Not Modified)。

如果服务器不配合或者回答不到位(例如网站改了模板,所有网页的Last-Modified都变动了),那就靠猜。你可以根据经验和对网站的了解设定相应的参数,如果样本大的话,通过统计预测。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文