通过id拉取大量推文
我有一个包含 5500 个推文 ID 的列表。对于每个推文 ID,我都会下载相关的推文文本。这些 ID 是不连续的并且来自许多不同的用户。
我看到的用于拉取特定推文的唯一 API 选项是 GET 状态/显示/:id。
一次只给出一条推文。由于速率限制为 350 次 API 调用/小时,这意味着下载数据大约需要 16 小时。
我是否缺少 API 调用或更好的技术?
I have a list of 5500 tweet ids. For each tweet id, I'm downloading the associated tweet text. The ids are non-sequential and from many different users.
The only API option I see for pulling a specific tweet is GET statuses/show/:id.
That gives only a tweet at a time. With rate limiting of 350 API calls / hr, that means ~16 hrs to download the data.
Is there an API call or better technique that I'm missing?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
您可以从 GNIP 购买推文。
You can buy tweets from GNIP.
不,恐怕没有。对于经过身份验证的用户,无法绕过 Twitter 每小时 350 次 API 调用。
No. I'm afraid none. There's no way to bypass twitters 350 API Calls per hour for authenticated users.
据我了解,Twitter API 有一个端点,每个请求最多可获取 100 条推文。您可以在以下位置找到详细信息: https://dev.twitter.com/rest/参考/获取/状态/查找
我使用 tweepy 的 statuses_lookup 方法: http://tweepy.readthedocs.org /en/v3.1.0/api.html#timeline-methods 因此,您检索推文的速度比一次请求一条推文要快得多。
As far as I understood, Twitter API has an end point to fetch up to 100 tweets per request. You can find the details at: https://dev.twitter.com/rest/reference/get/statuses/lookup
I use tweepy's statuses_lookup method: http://tweepy.readthedocs.org/en/v3.1.0/api.html#timeline-methods So, you can retrieve tweets much faster than requesting one tweet at a time.