如何通过seleniumRC保存网页

发布于 2024-09-13 16:09:41 字数 130 浏览 8 评论 0原文

我使用seleniumRC打开一个url，那么如何保存这个网页呢？如何实现像urllib.urlretrieve那样呢？但urllib无法操作页面中的javascript。还有一个问题：它会保存我所看到的 seleniumRC 打开的整个页面吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

风苍溪 2024-09-20 16:09:41

听起来您混淆了两个截然不同的库。

urllib：

该模块提供了用于通过万维网获取数据的高级接口。特别是，urlopen() 函数与内置函数 open() 类似，但接受通用资源定位器 (URL) 而不是文件名。

您可以使用 python 的 urllib 库从有效 URL 检索原始标记。该库不会调用页面上的任何嵌入式 JavaScript，因为该库从不尝试解析或呈现任何内容。

Selenium RC：

Selenium Remote Control (RC) 是一种测试工具，允许您使用任何支持 JavaScript 的主流浏览器以任何编程语言针对任何 HTTP 网站编写自动化 Web 应用程序 UI 测试。

Selenium RC 用于自动化测试。测试的执行通过 JavaScript 在 Web 浏览器中进行，但这是一个测试套件 — 您会收到有关测试状态的信息。 Selenium RC 不提供任何保存渲染页面图像的功能。

除非我误解了你的问题，否则你似乎正在寻找一个库，它允许你检索渲染的 HTML 页面的图像（包括 javascript DOM 操作）。如果确实如此，我建议查看 PyWebShot，它似乎提供了确切的功能。您可以在此处查看其实际操作的屏幕截图（以及以及一些有关它的附加信息）。

如果它不一定需要是一个 python 库，那么有许多 Web 服务可以提供屏幕截图：

回复收藏 0 原文

~没有更多了~

关于作者

恏ㄋ傷疤忘ㄋ疼

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

如何通过seleniumRC保存网页

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如何通过seleniumRC保存网页

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。