具有多个页面的 javascript 表上的 Python BeautifulSoup

发布于 2024-12-27 15:16:24 字数 552 浏览 2 评论 0原文

我曾经有一个 python 脚本，可以使用 Mechanize 和 BeautifulSoup 正确地从下表中提取数据。但是，该网站最近已将表格的编码更改为 javascript，并且我在使用它时遇到了麻烦，因为表格有多个页面。

http://www.fangraphs.com/leaders.aspx?pos=all&stats=bat&lg=all&qual=0&type=8&season=2011&month=0&season1= &ind=0&team=25&players=0

例如，在上面的链接中，我如何获取第 1 页和第 1 页的数据表2？ FWIW，URL 没有改变。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

厌味 2025-01-03 15:16:24

你最好的选择是运行一个无头浏览器，例如 phantomjs 它理解 JavaScript、DOM 等的所有复杂性，但你会必须用Javascript编写代码，好处是你可以做任何你想做的事情，使用BeautifulSoup解析html暂时很酷，但从长远来看却令人头疼。那么当你可以访问 DOM 时为什么还要进行抓取呢

回复收藏 0 原文