通过id拉取大量推文

发布于 2024-12-11 13:26:43 字数 301 浏览 0 评论 0原文

我有一个包含 5500 个推文 ID 的列表。对于每个推文 ID,我都会下载相关的推文文本。这些 ID 是不连续的并且来自许多不同的用户。

我看到的用于拉取特定推文的唯一 API 选项是 GET 状态/显示/:id

一次只给出一条推文。由于速率限制为 350 次 API 调用/小时,这意味着下载数据大约需要 16 小时。

我是否缺少 API 调用或更好的技术?

I have a list of 5500 tweet ids. For each tweet id, I'm downloading the associated tweet text. The ids are non-sequential and from many different users.

The only API option I see for pulling a specific tweet is GET statuses/show/:id.

That gives only a tweet at a time. With rate limiting of 350 API calls / hr, that means ~16 hrs to download the data.

Is there an API call or better technique that I'm missing?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

不即不离 2024-12-18 13:26:43

您可以从 GNIP 购买推文。

You can buy tweets from GNIP.

坐在坟头思考人生 2024-12-18 13:26:43

不,恐怕没有。对于经过身份验证的用户,无法绕过 Twitter 每小时 350 次 API 调用。

No. I'm afraid none. There's no way to bypass twitters 350 API Calls per hour for authenticated users.

夏夜暖风 2024-12-18 13:26:43

据我了解,Twitter API 有一个端点,每个请求最多可获取 100 条推文。您可以在以下位置找到详细信息: https://dev.twitter.com/rest/参考/获取/状态/查找
我使用 tweepy 的 statuses_lookup 方法: http://tweepy.readthedocs.org /en/v3.1.0/api.html#timeline-methods 因此,您检索推文的速度比一次请求一条推文要快得多。

As far as I understood, Twitter API has an end point to fetch up to 100 tweets per request. You can find the details at: https://dev.twitter.com/rest/reference/get/statuses/lookup
I use tweepy's statuses_lookup method: http://tweepy.readthedocs.org/en/v3.1.0/api.html#timeline-methods So, you can retrieve tweets much faster than requesting one tweet at a time.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文