httpclient使用get方法调用URL,得到403
String url = "http://cn.made-in-china.com";//使用此URL则返回200 //url为http://www.chinanews.com/hwjy/2013/02-20/4579723.shtml就返回403 HttpClient httpClient = new HttpClient(); GetMethod getMethod = new GetMethod(url); int statusCode = httpClient.executeMethod(getMethod); System.out.println(statusCode);
我就想问下,为什么有的URL访问返回200状态码,有的返回403状态码,如果是网站应用设置的,则他是如何做到这一点的?请高手指教啊~~~~~~~
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(7)
set ua
那网站应用如何做到防采集的呢?通过什么方法?
防采集呗。
HTTP协议我知道,状态码的意思我也了解,只是不明白为什么换个链接而已,返回不同的状态码
这是协议http协议的约定 200表示成功
是加上这样的代码么? httpClient.getParams().setParameter( HttpMethodParams.USER_AGENT, "Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.9.1.2) Gecko/20090803"); 我不知道自己少了什么JAR包,httpclient没有getParams方法
这个其实很好解决,你用curl -I访问某个URL,就可以看到往来的header明细。
我刚才测试过chinanews的地址,是返回200的,如果是403,可能是根据你的IP或者header请求做的判断,你可以更换header(user-agent)或ip验证。