Python获取数据403
我正在尝试使用 urllib2 从网页获取数据。该页面在浏览器上可见,但通过脚本我不断收到 HTTPError: HTTP Error 403: Forbidden
我也尝试通过更改用户代理字符串来模仿浏览器请求,但没有成功。
对此有什么想法吗?
I am trying to fetch data from a webpage using urllib2. The page is visible on the browser but through the script I keep getting HTTPError: HTTP Error 403: Forbidden
I also tried mimicking a browser request by changing the user-agent string but no success.
Any ideas on this?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
我尝试使用篡改数据和 Firefox 只发送用户代理,结果得到 403。
尝试添加其他标题:
我尝试过,这应该可行。
I tried with tamper data and firefox to send only user agent, and I get 403.
Try to add other headers:
I tried, and this should work.
该网站正在检查您的
User-Agent
,只需将其设置为Internet Explorer
:我确认这适用于
wget
,并且您会收到 403,除非您将您的用户代理设置为 Internet Explorer。The site is checking your
User-Agent
just set it toInternet Explorer
:I confirmed that this works with
wget
, and you get 403 unless you set your user agent to Internet Explorer.:) 我也在尝试从 NSE 获取报价!就像 pythonFoo 说你需要额外的标头。然而,只接受就足够了。
用户代理可以说 python (保持真实!)
:) Am trying to get quotes from NSE too ! like pythonFoo says you need additional headers. Hower only Accept is sufficient.
The user-agent can say python ( stay true ! )