事件源实施——它会扩展吗？

发布于 2024-09-01 23:24:08 字数 861 浏览 8 评论 0原文

情况：

我目前正在为一个社交网站设计一个提要系统，每个用户都可以通过该系统获得其朋友活动的提要。我有两种可能的方法来生成提要，我想问哪种方法在扩展能力方面最好。

来自所有用户的事件都收集在一个中央数据库表 event_log 中。用户在friends 表中配对为好友。我们使用的 RDBMS 是 MySQL。

标准方法： 当用户请求他们的 feed 页面时，系统通过将 event_log 与 friends 内部连接来生成 feed。然后结果被缓存并设置为 5 分钟后超时。通过改变此超时来实现缩放。

假设方法： 任务在后台运行，对于 event_log 中的每个新的未处理项目，它会在数据库表 user_feed 中创建条目，将该事件与所有好友用户配对发起该事件的用户。一个表行将一个事件与一个用户配对。

标准方法的问题是众所周知的——如果很多人的缓存同时过期怎么办？该解决方案也不能很好地扩展——简述是让源更新尽可能接近实时。

在我看来，假设的解决方案似乎要好得多；所有处理都是离线完成的，因此没有用户等待页面生成，并且没有连接，因此数据库表可以跨物理机器分片。但是，如果用户有 100,000 个好友，并在一次会话中创建 20 个事件，则将导致向数据库中插入 2,000,000 行。

问题：

问题归结为两点：

上面提到的最坏情况是否有问题，即表大小是否对 MySQL 性能有影响，以及为每个表大量插入数据是否存在问题事件？
还有什么我错过的吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

还如梦归 2024-09-08 23:24:08

我认为你假设的系统生成了太多数据；首先，在全球范围内，随着用户群变得越来越大、相互联系越来越紧密，对 user_feed 的存储和索引需求似乎呈指数级增长（这对于社交网络来说可能是理想的）；其次，考虑一下如果在一分钟内 1000 个用户每个人都输入了一条新消息，并且每个用户都有 100 个朋友 - 那么您的后台线程有 100 000 个插入要做，并且可能很快就会落后。

我想知道您提出的两个解决方案之间是否可以做出妥协，其中后台线程更新表last_user_feed_update，该表包含每个用户的单行以及上次更改用户提要的时间戳。

然后，虽然需要完全连接和查询来刷新 feed，但对 last_user_feed 表的快速查询将告诉您是否需要刷新。这似乎减轻了标准方法的最大问题，并避免了存储大小的困难，但后台线程仍然有很多工作要做。

回复收藏 0 原文