支持 javascript 渲染的命令行浏览器,仅输出渲染的 HTML
我想要一种快速的方法来检索给定 URL 的页面,但不仅仅获取简单的 HTML,而是执行 javascript 后的 HTML。
我知道 CutyCapt,但对我来说它很慢,某些网页需要 10 秒以上。另外,我不习惯使用 --min-wait 选项,因为它可能返回空/非最终 HTML。而且它似乎有时会给出不同的 HTML。有时它会呈现由 javascript 函数创建的元素,有时则不会。
还有其他选择吗?我想给出一个 URL 并获取渲染后的 html。
I want a fast way to retrieve a page given a URL, but not getting only the simple HTML, but the HTML after executing javascript.
I'm aware of CutyCapt, but for me it is slow, taking more than 10 seconds for some web pages. Also I'm not comfortable using the --min-wait option, as it can return empty/non-final HTMLs. Also it seems to give different HTMLs from time to time. Sometimes it renders a element which is created by a javascript function, sometimes it does not.
Is there any alternatives? I want to give an URL and get the rendered html back.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以从 svn 存储库获取当前版本的 CutyCapt 并使用 Qt 4.7.1 进行编译(或来自 Qt 的 trunk 版本)当前的 Webkit 实现比 CutyCapt 编译版本中使用的版本更快,如果仍然不够快,您可以分析代码并尝试找出是否可以优化。 。
You could take the current version of CutyCapt from the svn repository and compile it with Qt 4.7.1 (or the trunk version from the Qt git repository. The current Webkit implementation is faster than version 4.4.0 that is used in the compiled version of CutyCapt. If it still is not fast enoupgh you could profile the code and try to find out if it can be optimized.