数据挖掘-twitter、微博之类网站的大量数据分析是怎么做的?什么原理?采集吗?

发布于 2016-11-10 16:30:12 字数 230 浏览 1152 评论 2

经常可以看见有人通过分析微博、twitter的信息得出一些结论,例如通过分析微博发布信息的关键字、标签,来得知人们现在关心什么,人们高不高兴、甚至能通过微博信息分析出股票涨势啥的。

他们怎么分析的???

采集微博信息,然后匹配关键字????微博也没有页面能输出所有用户发布的所有信息吧,难道他们follow一些特定的人,然后只采集他们的信息???

谁知道这种微博数据分析的原理是什么,具体怎么做的。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

甜柠檬 2017-09-10 12:43:47

产生信息的时候 记录各种统计数据
之后一次性的去做统计 不现实啊

泛泛之交 2017-06-12 14:02:39

应该主要靠关键字(以及近义词)匹配。可以获取一段时间内的全部流量(如果你跟twitter关系不错的话)或者某些大V的流量然后进行关键词检索,做出分析。而分析呢,应该是根据自然语义将关键词与各种信息进行关联,如“哭泣”就和伤心有关,然后就可以做出数据分析了。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文