抓取某个网站 本地正常 服务器上却很快便503
发现了这么一个问题,抓取一个网站,在本地测试时,一切正常,但部署到服务器上,大概20来秒便都是503错误了,curl 某个链接 有这样的输出:
<div style="margin-left:180px;width:695px;margin-top:72px;text-align:center">
<h1 style="font-size:27px">503~~访问得太多了,请明天再访问</h1>
<div style="background:#fff;height:341px;margin-top:32px">
<div style="margin-top:100px;float:left">
<img style="float:left;margin-left:142px" src="http://www.xiachufang.com/pic/xiaohai.png">
<div style="margin-top:39px;text-align:left;padding-left:27px;float:left;">
<p>访问得太多了,请明天再访问</p>
</div>
</div>
</div>
</div>
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(9)
也有可能是空间服务商做的限制
访问次数太频繁,服务器会关闭你的请求,请控制访问频率,
服务器上硬件环境太好,速度当然快了。。做做限制
如果你的pc配置和服务器一样,带宽也一样,那就很奇怪~
请求速度过快了,脚本里面设置下sleep时间吧,在本地测试下阈值。
服务器上网速好,频率高,所以超限了。
你设置下服务器抓取频率
各位各位,同样的程序,为什么在我本地跑就没这个限制呢?
控制一下访问速度试试
就是,这么明显的提示