关于如何抓取新浪微博信息。

发布于 2021-11-21 22:54:45 字数 259 浏览 693 评论 8

我现在要做一个微博的采集和分析软件,大概的效果就是和图上一样,现在关键的问题是怎么将微博的内容提取出来,求指点……

假如说我想获取有关“房地产”的信息,希望能够将所有有关的微博信息抓取下来,然后能进行一定的筛选,以指定的方式显示出来。本人菜鸟,希望大家给点建议和指导!要爬虫算法等等知识吗?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(8

彼岸花ソ最美的依靠 2021-11-22 09:28:24

我抓取某个人的微博信息的时候会转到注册页面,请问这个怎么弄啊?

例如抓取:http://weibo.com/u/1768205562

会自动跳转到注册页面

用浏览器看是没问题的,用程序就会跳转,求解决啊!!!

回忆凄美了谁 2021-11-22 09:07:47

求抓取用户名  内容 图片地址  视频地址  的爬虫

醉生梦死 2021-11-22 09:06:24

实验的兄弟们,这个可以完全抓下来吗

清晨说ぺ晚安 2021-11-22 09:00:23

好的,新浪开发平台给的API确实有诸多限制。看来需要学习爬虫和正则表达式!

明媚如初 2021-11-22 08:00:47

用微博给的api

你曾走过我的故事 2021-11-22 07:45:59

用微博给的api

墨洒年华 2021-11-22 07:17:37

好的,谢谢,主要我啥都不懂!你的意思是说相对于Web页面,手机版的微博,页面可能没有那么复杂,其结构简单,没有那么多冗余的信息,所以可以比较轻松进行抓取?

乞讨 2021-11-22 01:16:26

正则表达式嘛~

不过见过一些其他的微博爬虫,貌似爬手机版的会轻松很多

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文