怎么统计web服务器下的URL列表,判断其中链接数的更新情况?
由于项目需要,需要去统计指定网络范围(如sina)下所有URL,并统计其各个web服务器下的URL列表,判断其中链接数的更新状况,估算每个URL源的更新周期。(本地没有缓存)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
由于项目需要,需要去统计指定网络范围(如sina)下所有URL,并统计其各个web服务器下的URL列表,判断其中链接数的更新状况,估算每个URL源的更新周期。(本地没有缓存)
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(1)
向服务器请求的时候header带上If-Modified-Since,问服务器有没有更新,如果更新了就返回文件,没有的话会返回304(Not Modified)。
如果服务器不配合或者回答不到位(例如网站改了模板,所有网页的Last-Modified都变动了),那就靠猜。你可以根据经验和对网站的了解设定相应的参数,如果样本大的话,通过统计预测。