当前位置：文江博客话题详情

评论帖子可扩展性：每个用户排名前 n，1 次更新，大量阅读

发布于 2024-07-27 17:43:24 字数 342 浏览 7 评论 0原文

情况是这样的。数百万用户的网站。每个用户的页面都有一个消息部分。任何人都可以访问用户的页面，在那里他们可以留言或查看最后 100 条消息。

消息是带有一些额外元数据的短文本片段。每条消息都必须永久存储，唯一必须实时快速的是消息更新和阅读（人们将其用作聊天）。将经常读取消息计数以检查更改。可以定期归档旧消息（> 100 条），但它们必须可访问。

目前，所有内容都在一个大数据库表中，读取消息列表和发送更多更新的人们之间的争用正在成为一个问题。

如果您必须重新架构系统，您会使用什么存储机制/缓存？这里可以使用什么样的计算机科学学习？（例如集合、列表访问等）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

狼性发作 2024-08-03 17:43:24

一些一般性想法，不特定于任何特定技术：

按用户 ID 划分数据。这个想法是，您可以将用户空间统一划分为大小大致相同的不同分区。您可以使用适当的哈希函数来跨分区划分用户。最终，每个分区都属于一台单独的机器。然而，即使在同一台机器上的不同表/数据库上，这也将消除一些争用。分区限制了争用，并为未来“线性”扩展打开了大门。这也有助于负载分配和横向扩展。
当选择一个哈希函数来对记录进行分区时，寻找一个能够最大限度地减少添加/删除分区时必须移动的记录数量的函数。
与许多其他应用程序一样，我们可以假设该服务的使用遵循幂律曲线：少数用户页面导致大量流量，然后是长尾。缓存方案可以利用这一点。曲线越陡，缓存就越有效。考虑到短消息，如果每个页面显示 100 条消息，并且每条消息平均为 100 字节，那么 1GB RAM 缓存中可以容纳大约 100,000 个首页。这些缓存的页面可以延迟写入数据库。在 1000 万用户中，有 100,000 个用户有望发挥作用。
可能使用相同的哈希方案对 Web 服务器进行分区。这使您可以保存单独的 RAM 缓存而不会发生争用。潜在的好处是随着用户数量的增长而增加缓存大小。
如果适合您的环境，确保新消息最终写入数据库的一种方法是在将它们放入 RAM 缓存后立即将它们放入持久消息队列中。队列不会出现争用，有助于确保消息在机器故障时不会丢失。