如何在现代多核/多插槽计算机上扩展 TCP 侦听器

发布于 2024-08-09 01:52:41 字数 218 浏览 6 评论 0原文

我有一个用 C 语言编写的守护进程，需要同时处理 20-150K TCP 连接。它们是长期运行的连接，很少会断开。它们在任何给定时间传输的数据量都非常小（很少超过 MTU，甚至......这是一个激励/响应协议），但对它们的响应时间至关重要。我想知道当前的 UNIX 社区正在使用什么来获取大量套接字，并最大限度地减少它们的响应延迟。我见过围绕复用连接到分叉工作池、线程（每个连接）、静态大小的线程池的设计。有什么建议吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不回头走下去 2024-08-16 01:52:41

如果性能至关重要，那么您确实需要采用多线程事件循环解决方案 - 即一个工作线程池来处理您的连接。不幸的是，没有一个抽象库可以在大多数 Unix 平台上执行此操作（请注意，libevent 与大多数事件循环库一样只是单线程的），因此您必须自己完成这些肮脏的工作。

在 Linux 上，这意味着将边缘触发的 epoll 与工作线程池一起使用（Windows 将具有 I/O 完成端口，该端口在多线程环境中也可以正常工作 - 我不确定其他 Unix 是否如此）。

顺便说一句，我已经做了一些工作，试图在上抽象 Linux 和 Windows I/O 完成端口上的边缘触发 epoll http://nginetd.cmeerw.org（正在进行中，但可能提供一些想法）。

回复收藏 0 原文

意中人 2024-08-16 01:52:41

如果您具有系统配置访问权限不要过度，并设置一些 iptables/pf/etc 来跨 n 个守护进程实例（进程）负载平衡连接，如下所示开箱即用。根据守护进程的性质，n 的阻塞程度应与系统上的核心数或更高数倍有关。这种方法看起来很粗糙，但它可以处理损坏的守护进程，甚至在必要时重新启动它们。此外，迁移会很顺利，因为您可以开始将新连接转移到另一组进程（例如，新版本或迁移到新盒子），而不是服务中断。最重要的是，您可以获得一些功能，例如源亲和性，它可以显着帮助缓存和争用有问题的会话。

如果您没有系统访问权限（或者操作员不会被打扰），您可以使用负载均衡器守护进程（有很多开源守护进程）而不是 iptables/pf/etc 并使用n 服务守护进程，如上。

此外，这种方法有助于分离端口的权限。如果外部服务需要在低端口（<1024）上提供服务，则只需要运行特权/或管理员/root 或内核的负载均衡器。）

我过去编写了几个 IP 负载均衡器，它可能非常有用生产中容易出错。您不想支持和调试它。此外，与外部代码相比，运营和管理更倾向于对您的代码进行事后猜测。

回复收藏 0 原文

习惯成性 2024-08-16 01:52:41

最简单的建议是使用 libevent，它可以轻松编写一个简单的非阻止符合您要求的单线程服务器。

如果每个响应的处理需要一些时间，或者它使用一些阻塞 API（就像数据库中的几乎任何内容），那么您将需要一些线程。

一个答案是工作线程，您可以在其中生成一组线程，每个线程都侦听某个队列以进行工作。如果您愿意，它可以是单独的进程，而不是线程。主要区别在于告诉工作人员要做什么的通信机制。
另一种方法是使用多个线程，并为每个线程提供这 150K 连接的一部分。每个服务器都有自己的进程循环，并且工作原理与单线程服务器类似，但侦听端口除外，该端口将由单个线程处理。这有助于在核心之间分散负载，但如果您使用阻塞资源，它将阻塞由该特定线程处理的所有连接。

如果你小心的话，libevent 允许你使用第二种方式；但还有一个替代方案：libev。它不像 libevent 那样广为人知，但它特别支持多循环方案。

回复收藏 0 原文

谁人与我共长歌 2024-08-16 01:52:41

我认为哈维尔的回答最有道理。如果您想测试该理论，请查看 node javascript 项目。

Node 基于 Google 的 v8 引擎，该引擎将 javascript 编译为机器代码，并且对于某些任务来说速度与 c 一样快。它也基于 libev，被设计为完全非阻塞，这意味着您不必担心线程之间的上下文切换（一切都在单个事件循环上运行）。在这方面它与 erlang 非常相似。

现在，使用 Node.js 在 JavaScript 中编写高性能服务器变得非常非常容易。您还可以稍加努力，用 c 编写自定义代码，并为节点创建绑定以调用它来进行实际处理（查看节点源代码以了解如何执行此操作 - 文档有点粗略，位于那一刻）。作为一个更丑陋的替代方案，您可以将自定义 C 代码构建为应用程序并使用 stdin/stdout 与其进行通信。

我自己测试了超过 150k 连接的节点，绝对没有任何问题（当然，如果所有这些连接要同时通信，您将需要一些强大的硬件）。 Node.js 中的 TCP 连接平均仅使用 2-3k 内存，因此理论上每 1GB RAM 可以处理 350-500k 连接。

注意 - Node.js 目前在 Windows 上不受支持，但它仅处于开发的早期阶段，我想它会在某个阶段被移植。

注 2 - 您必须确保从 Node 调用的代码不会阻塞

回复收藏 0 原文