解析 HTML 时如何处理重定向? - Python
我正在尝试通过 Python 脚本提交一些表单,我正在使用机械化库。
这样我就可以实现一个临时 API。
问题是,在提交之后,会返回一个空白页面,通知正在处理请求,几秒钟后,页面会重定向到最终页面。
我知道这听起来有点通用,但我不确定发生了什么。 :)
有什么想法吗?
I'm trying to submit a few forms through a Python script, I'm using the mechanized library.
This is so I can implement a temporary API.
The problem is that before after submission a blank page is returned informing that the request is being processed, after a few seconds the page is redirected to the final page.
I understand if it might sound a bit generic, but I'm not sure what is going on. :)
Any ideas?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
传统上,当您获得重定向时,响应的状态代码是 302,并且有一个位置标头指示浏览器下一步要去哪里。其他技术(蹩脚)是放置 元刷新标签 在文档的头部。
我想有很多方法可以用 javascript 来做到这一点(也很蹩脚)
Traditionally When you get a redirect, the status code of the response is 302, and there's a location header that instructs the browser where to go next. Other techniques(that are lame) would be to put a meta refresh tag in the head of the document.
And I suppose there's any number of ways to do it with javascript(also lame)
如果它使用元标记,那么您需要手动解析 HTML。否则 mechanize 将自动处理重定向。
If it uses meta tags then you need to parse the HTML manually. Otherwise mechanize will handle the redirect automatically.