使用 Python 如何爬取这样的数据 BeautifulSoup?request?
用于测试的链接是这样的
http://www.zhcw.com/ssq/kjgg/10006509.shtml
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
用于测试的链接是这样的
http://www.zhcw.com/ssq/kjgg/10006509.shtml
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(2)
通过查找,发现这些数据是加载完页面再由JS动态写入的:
接着来找
zj
,上面两行有:其中,con为
$.trim($('#currentScript').html().replace('<div>', '').replace('</div>', ''))
也就是,将
$('#currentScript').html()
的内容,去掉div
标签后,过滤首尾空白字符后,取[
到]
中的数据,当做JSON解析。这部分操作可以通过Python完成,所以,先用Python的BeautifulSoup找到
#currentScript
,再手动替换,然后当做JSON解析即可这样,就可以得到一个JSON字符串了,然后放到python的JSON解析器解析成JSON对象,这个你自己写吧。