基于 Java 的大容量交易 Web 应用程序

发布于 2024-09-06 11:46:36 字数 502 浏览 4 评论 0原文

我几乎没有处理大流量交易网站的经验，最近遇到了这个有趣的问题。我有兴趣知道在高负载（每秒数千个请求）下 Java Web 应用程序的瓶颈会出现在哪里。如果有人能给我一个高层次的方法来思考以下问题，那就太好了！

我唯一想到的是使用 memcached 缓存数据库查找，但我不知道如何计算每个请求将花费的时间，以及系统每秒可以处理多少个请求处理。

问题： 互联网规模的应用程序必须设计为能够处理大量交易。描述每秒必须平均处理 30,000 个 HTTP 请求的系统设计。对于每个请求，系统必须使用通过 URL 查询字符串传入的关键字来查找包含 5000 万个单词的字典。每个响应将包含一个包含单词定义的字符串（100 字节或更少）。

描述系统的主要组件，并注意哪些组件应该是定制的以及哪些组件可以利用第三方应用程序。包括每个组件的硬件估计。请注意，设计应以最低的硬件/软件许可成本实现最高的性能。

记录提出估算的基本原理。

描述如果每个定义为 10 KB，设计将如何改变。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

绿阴红影里的.如风往事 2024-09-13 11:46:37

作为背景，您可能会注意到诸如规范标记之类的基准标记。与您的场景相比，处理量明显更多，但您会发现 30,000 个请求/秒是一个相对较高的数字，但并不是高得离谱。

您还可能会找到加入 et al 很有用。（免责声明：他们是同事。）

在您的场景中，我预计按成本降序排列：

数据库检索
网络活动读取和返回请求
简单处理

您没有进行复杂的处理（例如图形渲染或火箭科学类型的数学）。所以首先猜测：如果你的字典是一个数据库，那么执行查询的成本将主导其他一切。传统上，当我们在 Web/应用程序服务器层遇到瓶颈时，我们会通过添加更多实例来进行扩展，但如果数据库是瓶颈，那就更成问题了。那么一个方向是：您对数据库引擎的性能有何期望？30k tps 似乎可行吗？

您的第一个观察结果：缓存内容是一种常用的策略。在这里，您（大概）在整个字典中随机命中，因此缓存最近的答案本身可能不会有帮助，除非......您可以缓存整个内容吗？

50,000,000 * (100 + 开销) == ??

在 64 位操作系统上的 64 位 JVM 上也许它适合？

如果不是（并且随着数据变得非常大，那么可能不会）那么我们需要扩展。因此可以使用对高速缓存进行切片的策略。拥有（例如）4 台服务器，分别为 AF、GM、NP、TZ 提供服务（并且注意，4 个独立的缓存或 4 个独立的数据库）。让调度员指导请求。