如何使用 nltk - 正则表达式从 Twitter 获取流数据
我是 Python 新手,老板给了我一个任务来执行此操作:
- 使用 NLTK 和正则表达式在 JSON
- 解析
- 中从 twitter 获取流数据将其保存到文件库或数据库文件,好的
有没有人知道如何从中获取流数据使用上述步骤推特?
您的帮助将非常感激:)
I am newbie in Python and given a task from my boss to do this :
- Grab streaming data from twitter in JSON
- Parsing using NLTK and Regular Expression
- Save it to file base or database file, ok
Is there anyone know how to grab a streaming data from twitter using the step above ?
Your help would be very grateful :)
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
快速 Google 搜索即可找到 Tweepy,这是一个用于访问 Twitter API 的 Python 库。这应该可以帮助您开始。在解析数据方面,您需要更具体地说明要解析的内容。
A quick Google search yields Tweepy, which is a python library for accessing the Twitter API. This should get you started. In terms of parsing the data, you'll need to be a little more specific as to what you want to parse.
这应该为您指明正确的方向,
它不会
eval
所以我使用simplejson
http://simplejson.github.com/simplejson/This should point you in the right direction
it wouldn't
eval
so i usedsimplejson
http://simplejson.github.com/simplejson/您将同一问题发布了两次,显然:我在另一篇文章中回答了。
如何从twitter 使用 nltk - 正则表达式与 pycurl 连接
You posted the same question twice, appearently: I answered in the other post.
How to grab streaming data from twitter connect with pycurl using nltk - regular expression