使用 MozRepl 和 Mechanize::Firefox 获取渲染的 HTML
我刚刚了解到 MozRepl 与 Perl 的 WWW::Mechanize::Firefox 结合使用的神奇之处,并试图弄清楚如何使用它来抓取 GWT 页面(例如:https://www.google.com/offers/home#!details/4bc7fd6bd3feb311/XYW81TXGLA88TR42)
我真正想要的是渲染的 html,而不是实际的 html。我真的很感激一个我如何得到这个的例子。
I've just been introduced to the wonders of MozRepl used in conjunction with Perl's WWW::Mechanize::Firefox, and was trying to figure out how to use it to crawl GWT pages (e.g.,: https://www.google.com/offers/home#!details/4bc7fd6bd3feb311/XYW81TXGLA88TR42)
What I really want is the rendered html, not the actual html. Would really appreciate an example of how I would get this.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
我决定使用神奇的 PhantomJS 来完成工作。使用 Phantom 作为服务器端工具来获取动态网页的渲染 HTML 非常容易。
I decided to use the fantastic PhantomJS to get the job done. It's incredibly easy to use Phantom as a server side tool to get the rendered HTML of a dynamic webpage.