比如要抓取这条微博下的评论,通过抓取HTML来获取呢还是 微博接口来获取,我看了下接口,需要一个授权获取access_token然后才能获取评论,直接通过代码怎么让用户授权获取access_token呢?
从控制台看一下http://weibo.com/aj/v6/comment/big?ajwvr=6&id=3833719532508422&...这个地址就是获取评论的 然后根据id来抓
如果不是全量抓取,建议你用微博api来抓,如果爬虫来抓,是需要登录相关信息的,也就是在curl的时候需要带上cookie相关信息,会比较复杂,如果cookie有一定实效性更麻烦了
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
暂无简介
文章 0 评论 0
接受
发布评论
评论(2)
从控制台看一下
http://weibo.com/aj/v6/comment/big?ajwvr=6&id=3833719532508422&...
这个地址就是获取评论的 然后根据id来抓
如果不是全量抓取,建议你用微博api来抓,如果爬虫来抓,是需要登录相关信息的,也就是在curl的时候需要带上cookie相关信息,会比较复杂,如果cookie有一定实效性更麻烦了