python selenium 抓取含有 javascript网页表格如何翻页的问题

发布于 2021-11-28 15:57:56 字数 822 浏览 763 评论 3

爬虫爬取新浪财经(http://finance.sina.com.cn/stock/usstock/sector.shtml)上的美股数据,网页中包含了javascript,我用selenium 抓取时只能抓到第一页表格,我gaizenm

from selenium import selenium

from selenium import webdriver
browser=webdriver.PhantomJS(executable_path=r'D:phantomjs-2.1.1-windowsbinphantomjs.exe')
url=r'http://finance.sina.com.cn/stock/usstock/sector.shtml'
browser.get(url)
html = browser.execute_script("return document.documentElement.outerHTML")

这样得到的html只有第一页,请问怎么才能拿齐全部数据呢

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

夜血缘 2021-12-03 21:37:25

循环获取数据,如果是JavaScript就用ajax 获取。AJAX通过抓包提取

复古式 2021-12-03 21:35:32

可以参考下这个文档哦~http://doc.shenjianshou.cn/renderJS.html

高跟鞋的旋律 2021-12-03 19:55:41

用browser获取到翻页标签的对象,调用click方法,再延时若干秒,就可以翻页了。

还可以试着去抓包,比用selenium模拟访问要效率很多。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文