关于蜘蛛,如何提高抓取asp.net网站速度?

发布于 2022-08-27 12:39:27 字数 394 浏览 24 评论 0

因为业务需要,需要经常抓取一些网站内部的数据,我们的程序通过模拟浏览器登陆,然后抓取,对于PHP、JAVA、ASP程序的网站基本不存在问题,最慢的也能保持一个页面大概25秒左右,基本满足需要,但少部分ASP.NET的网站由于数据的列表都被记录到__VIEWSTATE里,我们在抓取时,必须POST过去一个巨大无比的__VIEWSTATE变量,而带回页面的数据也含有一个巨大无比的__VIEWSTATE,而且没有经过gzip压缩,导致ASP.NET网站的速度基本都是巨慢无比,大概一个页面时间是10分钟左右,实在是太慢了,所有想请教,各位有没有办法能加快抓取asp.net网站的速度,如果我采用分布式,对于ASP.NET每个session抓取一部分,然后各自把抓取到的数据拼合在一起,是否会奏效?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文