如何使用 python 脚本查看从 URL 页面生成的源代码而不是源代码?
我有一些 url 需要解析,他们使用了一些 javascript 来动态创建它。所以如果我想用 python 解析结果生成的页面...我该怎么做?
Firefox 在网络开发人员方面做得很好...所以我认为这是可能的...但我不知道从哪里开始...
帮助
谢谢
I have some url to parse, and they used some javascript to create it dynamicly. So if i want to parse the result generated page with python... how can i do that ?
Firefox do that well with web developer... so i think it possible ... but i don't know where to start...
Thx for help
lo
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
我通过在页面加载后将 document.body.innerHTML 执行 POST 到 Python 中的 CGI 脚本来完成此操作。
对于解析来说,BeautifulSoup 是一个不错的选择。
I've done this by doing a POST of document.body.innerHTML, after the page is loaded, to a CGI script in Python.
For the parsing, BeautifulSoup is a good choice.
如果你想要生成源代码,你需要一个浏览器,我认为你不能只使用 python。
I you want generated source you'll need a browser, I don't think you can with only python.