当前位置：文江博客话题详情

Python Selenium Crawler

python selenium 抓取含有 javascript网页表格如何翻页的问题

发布于 2021-11-28 15:57:56 字数 822 浏览 763 评论 3

爬虫爬取新浪财经(http://finance.sina.com.cn/stock/usstock/sector.shtml)上的美股数据，网页中包含了javascript，我用selenium 抓取时只能抓到第一页表格，我gaizenm

from selenium import selenium

from selenium import webdriver
browser=webdriver.PhantomJS(executable_path=r'D:phantomjs-2.1.1-windowsbinphantomjs.exe')
url=r'http://finance.sina.com.cn/stock/usstock/sector.shtml'
browser.get(url)
html = browser.execute_script("return document.documentElement.outerHTML")

这样得到的html只有第一页，请问怎么才能拿齐全部数据呢

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

夜血缘 2021-12-03 21:37:25

循环获取数据，如果是JavaScript就用ajax 获取。AJAX通过抓包提取

复古式 2021-12-03 21:35:32

可以参考下这个文档哦~http://doc.shenjianshou.cn/renderJS.html

高跟鞋的旋律 2021-12-03 19:55:41

用browser获取到翻页标签的对象，调用click方法，再延时若干秒，就可以翻页了。

还可以试着去抓包，比用selenium模拟访问要效率很多。

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

21355 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

玍銹的英雄夢

文章 0 评论 0

我不会写诗

文章 0 评论 0

十六岁半

文章 0 评论 0

浸婚纱

文章 0 评论 0

qq_kJ6XkX

文章 0 评论 0

旧伤还要旧人安

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文