httpclient使用get方法调用URL,得到403

发布于 2021-11-17 04:28:12 字数 432 浏览 950 评论 7

String url = "http://cn.made-in-china.com";//使用此URL则返回200
//url为http://www.chinanews.com/hwjy/2013/02-20/4579723.shtml就返回403
HttpClient httpClient = new HttpClient();
GetMethod getMethod = new GetMethod(url);
int statusCode = httpClient.executeMethod(getMethod);
System.out.println(statusCode);

我就想问下,为什么有的URL访问返回200状态码,有的返回403状态码,如果是网站应用设置的,则他是如何做到这一点的?请高手指教啊~~~~~~~

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(7

等你爱我 2021-11-22 13:38:52

set ua

韬韬不绝 2021-11-22 05:25:04

那网站应用如何做到防采集的呢?通过什么方法?

2021-11-22 02:36:16

防采集呗。

天涯离梦残月幽梦 2021-11-20 11:53:50

HTTP协议我知道,状态码的意思我也了解,只是不明白为什么换个链接而已,返回不同的状态码

噩梦成真你也成魔 2021-11-20 04:59:45

这是协议http协议的约定 200表示成功

猫九 2021-11-17 20:07:20

是加上这样的代码么? httpClient.getParams().setParameter( HttpMethodParams.USER_AGENT, "Mozilla/5.0 (X11; U; Linux i686; zh-CN; rv:1.9.1.2) Gecko/20090803"); 我不知道自己少了什么JAR包,httpclient没有getParams方法

长安忆 2021-11-17 18:31:31

这个其实很好解决,你用curl -I访问某个URL,就可以看到往来的header明细。

我刚才测试过chinanews的地址,是返回200的,如果是403,可能是根据你的IP或者header请求做的判断,你可以更换header(user-agent)或ip验证。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文