当前位置：文江博客话题详情

BeautifulSoup获取innerhtml数据

发布于 2024-09-08 07:22:59 字数 134 浏览 2 评论 0 原文

我正在尝试从网站读取数据。我可以看到我需要的值，但该值没有出现在下载的 html 代码中（使用 urllib2）。该值由某个 js 文件创建，并作为该 id 的 innerhtml 嵌入到网页中。 PS：如何提取？与浏览器不同，原始源代码无法渲染 js！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

内心激荡 2024-09-15 07:22:59

获取数据的另一种方法是让浏览器使用 Selenium 执行所有操作并读取渲染的 html。有点慢但肯定有效。

您可以在这里找到通过 Python 使用 Selenium 的入门指南：
http://jimmyg.org/blog/2009/开始使用-selenium-and-python.html

回复收藏 0 原文

坏尐絯 2024-09-15 07:22:59

您有两个选择：让浏览器保存 DOM（这包括脚本所做的所有更改）或使用 JavaScript 引擎执行嵌入的脚本。

对于后一种方法，请尝试使用基于 Java 的引擎，例如 Rhino 并使用 env.js。

回复收藏 0 原文

~没有更多了~

关于作者

羁客

暂无简介

0 文章

0 评论

20 人气

关注发私信

花开柳相依

文章 0 评论 0

关注

zyhello

文章 0 评论 0

关注

故友

文章 0 评论 0

关注

对风讲故事

文章 0 评论 0

关注

Oo萌小芽oO

文章 0 评论 0

关注

梦明

文章 0 评论 0

友情链接

文江博客

BeautifulSoup获取innerhtml数据

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签