Python 爬去网页数据,如今日头条,
最直接的方法,解析js, 模拟浏览器发送各种请求,然后获取服务器返回的结果就行.我刚刚看了看,服务器返回的都是json数据,很好解析.如下图是发送的请求,有的变量是动态的,需要特殊处理。
json
下面这个图是发送请求的服务器返回的结果:
至于python发送请求的东西,urllib,urllib2俩库就足够了。可以在网上查
urllib,urllib2
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(1)
最直接的方法,解析js, 模拟浏览器发送各种请求,然后获取服务器返回的结果就行.
我刚刚看了看,服务器返回的都是
json
数据,很好解析.如下图是发送的请求,有的变量是动态的,需要特殊处理。下面这个图是发送请求的服务器返回的结果:
至于python发送请求的东西,
urllib,urllib2
俩库就足够了。可以在网上查