使用 epoll 的 TCP 服务器的线程和扩展模型

发布于 2024-12-18 12:51:54 字数 826 浏览 0 评论 0原文

我已经阅读了 C10K 文档以及许多有关扩展套接字服务器的相关论文。所有的道路都指向以下几点：

避免“每个连接一个线程”的经典错误。
优先选择 epoll 而不是 select。
同样，unix 中的传统异步 io 机制可能很难使用。

我的简单 TCP 服务器仅在专用端口上的侦听套接字上侦听客户端连接。收到新连接后，解析请求并发回响应。然后优雅地关闭套接字。

我想我已经很好地掌握了如何使用 epoll 在单线程上扩展它。只需一个循环，为侦听套接字以及现有的客户端连接调用 epoll_wait。返回后，代码将处理新创建的新客户端连接，并根据刚刚收到信号的套接字管理现有连接的状态。也许还有一些逻辑来管理连接超时、套接字的优雅关闭以及每个连接的有效资源分配。看起来很简单。

但是，如果我想扩展它以利用多个线程和多个 CPU 核心，该怎么办？ 浮现在脑海中的核心思想是：

一个专用线程用于侦听 TCP 监听套接字上的传入连接。然后一组 N 个线程（或线程池）来处理所有活动的并发客户端连接。然后发明一些线程安全的方法，其中侦听线程将新连接（套接字）“分派”到可用工作线程之一。（Windows 中的 IOCP）。工作线程将在它正在处理的所有连接上使用 epoll 循环来执行单线程方法将执行的操作。

我走在正确的轨道上吗？或者是否有一个标准的设计模式可以在多个线程上使用 epoll 来实现 TCP 服务器？

关于监听线程如何将新连接分派到线程池的建议？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

故乡的云 2024-12-25 12:51:54

首先，请注意它是 C*10K*。如果您的数量低于 100 左右（在典型系统上），请不要担心。即使如此，它也取决于您的套接字正在做什么。
是的，但请记住，epoll 操作需要系统调用，它们的成本可能会也可能不会比您自己管理几个 fd_set 的成本贵。 poll 也是如此。在计数较低的情况下，每次迭代在用户空间中进行处理会更便宜。
当您不限于可以根据需要处理的几个套接字时，异步 IO 是非常痛苦的。大多数人通过使用事件循环来应对，但这会碎片化并反转您的程序流程。为此，通常还需要使用大型、笨重的框架，因为可靠且快速的事件循环并不容易实现。

第一个问题是，你需要这个吗？如果您通过生成线程来处理每个传入请求来轻松应对现有流量，那么请继续这样做。代码会更简单，并且所有库都会很好地运行。

正如我上面提到的，处理并发请求可能很复杂。如果您想在单个循环中执行此操作，则还需要在生成响应时保证 CPU 饥饿。

如果生成响应的成本很高，那么您提出的调度模型是典型的第一步解决方案。您可以分叉或使用线程。分叉或生成线程的成本不应成为选择池机制的考虑因素：相反，您应该使用这样的机制来限制或排序系统上的负载。

将套接字批处理到多个 epoll 循环上是过度的。如果您如此绝望，请使用多个进程。请注意，可以从多个线程和进程在套接字上接受。