python爬虫的时候,需要爬取的数据出现在javascript的变量里,只能通过正则获取么?
比如网址:http://gsxt.lngs.gov.cn/saicp...
里面的内容是:
<script type="text/javascript">
$(document).ready(function(){tzr_paging([{"blicno":"","invid":"1017186481","countryName":"","invtypeName":"自然人股东","sconformName":"1|","respformName":"","dom":"辽宁省铁岭市银州区广裕街7栋2单元601室","blictypeName":"中华人民共和国居民身份证","inv":"张淑坤"},{"blicno":"","invid":"1017186480","countryName":"","invtypeName":"自然人股东","sconformName":"1|","respformName":"","dom":"辽宁省铁岭市银州区广裕街农科巷阳光园六区三期15号楼2单元602室","blictypeName":"中华人民共和国居民身份证","inv":"刘莹雪"}],"2","211202000012015032445494","false");}); </script>
我要获取这个tzr_paging里的内容,除了正则还有别的方法获取这个数组么?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
你可以把字典起始部分的字符串抠出来,然后用eval得到这个字典
肯定是要把当做字符串来处理了。
可以用 phantomjs 去执行这段 js,然后把结果回调出来
http://phantomjs.org/