Python获取数据403

发布于 2024-10-09 14:15:30 字数 146 浏览 7 评论 0原文

我正在尝试使用 urllib2 从网页获取数据。该页面在浏览器上可见,但通过脚本我不断收到 HTTPError: HTTP Error 403: Forbidden

我也尝试通过更改用户代理字符串来模仿浏览器请求,但没有成功。

对此有什么想法吗?

I am trying to fetch data from a webpage using urllib2. The page is visible on the browser but through the script I keep getting HTTPError: HTTP Error 403: Forbidden

I also tried mimicking a browser request by changing the user-agent string but no success.

Any ideas on this?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

北方的韩爷 2024-10-16 14:15:30

我尝试使用篡改数据和 Firefox 只发送用户代理,结果得到 403。
尝试添加其他标题:

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-us,en;q=0.5
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 115
Connection: keep-alive

我尝试过,这应该可行。

I tried with tamper data and firefox to send only user agent, and I get 403.
Try to add other headers:

Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-us,en;q=0.5
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7
Keep-Alive: 115
Connection: keep-alive

I tried, and this should work.

陌上青苔 2024-10-16 14:15:30

该网站正在检查您的 User-Agent,只需将其设置为 Internet Explorer

request.add_header('User-Agent', 'Internet Explorer')

我确认这适用于 wget,并且您会收到 403,除非您将您的用户代理设置为 Internet Explorer。

The site is checking your User-Agent just set it to Internet Explorer:

request.add_header('User-Agent', 'Internet Explorer')

I confirmed that this works with wget, and you get 403 unless you set your user agent to Internet Explorer.

时光无声 2024-10-16 14:15:30

:) 我也在尝试从 NSE 获取报价!就像 pythonFoo 说你需要额外的标头。然而,只接受就足够了。
用户代理可以说 python (保持真实!)

:) Am trying to get quotes from NSE too ! like pythonFoo says you need additional headers. Hower only Accept is sufficient.
The user-agent can say python ( stay true ! )

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文