关于如何抓取新浪微博信息。
我现在要做一个微博的采集和分析软件,大概的效果就是和图上一样,现在关键的问题是怎么将微博的内容提取出来,求指点……
假如说我想获取有关“房地产”的信息,希望能够将所有有关的微博信息抓取下来,然后能进行一定的筛选,以指定的方式显示出来。本人菜鸟,希望大家给点建议和指导!要爬虫算法等等知识吗?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(8)
我抓取某个人的微博信息的时候会转到注册页面,请问这个怎么弄啊?
例如抓取:http://weibo.com/u/1768205562
会自动跳转到注册页面
用浏览器看是没问题的,用程序就会跳转,求解决啊!!!
求抓取用户名 内容 图片地址 视频地址 的爬虫
实验的兄弟们,这个可以完全抓下来吗
好的,新浪开发平台给的API确实有诸多限制。看来需要学习爬虫和正则表达式!
用微博给的api
用微博给的api
好的,谢谢,主要我啥都不懂!你的意思是说相对于Web页面,手机版的微博,页面可能没有那么复杂,其结构简单,没有那么多冗余的信息,所以可以比较轻松进行抓取?
正则表达式嘛~
不过见过一些其他的微博爬虫,貌似爬手机版的会轻松很多