Twitter Streaming API 的 Apache Cassandra 数据架构

发布于 2024-11-30 18:41:46 字数 189 浏览 0 评论 0原文

我知道 Twissandra 这是一个使用 Cassandra 的 twitter 克隆示例，但我有兴趣看看是否有人共享了 Cassandra模式不是克隆 Twitter 而是用于存储通过 Twitter Streaming API 发送的推文？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

听不够的曲调 2024-12-07 18:41:46

这在很大程度上取决于您在摄取数据后想要对数据执行哪种查询 - 我从您之前的问题“转储 Twitter Streaming API 推文...”中看到，您可能只想对其进行大批量处理。

如果是这种情况，您只需要担心负载平衡，确保集群中的每个节点处理 1/n 的写入负载，并包含 1/n 的数据 - 使用随机分区并为每条推文插入一行使用状态 id 作为行键将实现此目的。

但是，如果您想要执行诸如“给我给定用户的所有推文”之类的查询，您将需要一个稍微复杂的模式，因为上面建议的模式将要求您扫描所有数据。您可以在每行插入多条推文，行键是用户 ID，列键是推文 ID，值是推文。然后您可以使用 get_slice 来回答该查询。

一篇很好的（有些相关的）博客文章： http://blog.insidesystems.net/基本时间序列与卡桑德拉

回复收藏 0 原文

~没有更多了~

关于作者

狠疯拽

暂无简介

0 文章

0 评论

289 人气

关注发私信

友情链接

文江博客

Twitter Streaming API 的 Apache Cassandra 数据架构

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

初遇

听闻余生

Z_dy

左岸枫

1848719402

婷

友情链接

Twitter Streaming API 的 Apache Cassandra 数据架构

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

初遇

听闻余生

Z_dy

左岸枫

1848719402

婷

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。