当前位置：文江博客话题详情

如何以最少的停机时间移交 TCP 侦听套接字？

发布于 2024-08-20 01:04:28 字数 599 浏览 11 评论 0原文

虽然这个问题被标记为 EventMachine，但任何语言的通用 BSD 套接字解决方案也非常受欢迎。

一些背景：

我有一个应用程序侦听 TCP 套接字。它通过常规 System V 风格的初始化脚本启动和关闭。

我的问题是它需要一些时间来启动才能准备好为 TCP 套接字提供服务。它并不太长，也许只有 5 秒，但如果在工作日需要重新启动，那么 5 秒就太长了。现有连接保持打开状态并正常完成也很重要。

应用程序重新启动的原因有补丁、升级等。不幸的是，我发现自己的处境是，每隔一段时间，我就需要在生产中做这种事情。

问题：

我正在寻找一种方法来将 TCP 侦听套接字从一个进程巧妙地移交到另一个进程，从而只获得一瞬间的停机时间。我希望现有连接/套接字保持打开状态并完成旧进程中的处理，而新进程开始为新连接提供服务。

是否有一些经过验证的方法可以使用 BSD 套接字来执行此操作？（EventMachine 解决方案的奖励积分。）

是否有开源库可以实现此功能，我可以按原样使用，或用作参考？ （再次强调，非 Ruby 和非 EventMachine 解决方案也值得赞赏！）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

﹎☆浅夏丿初晴 2024-08-27 01:04:28

有几种方法可以在不停机的情况下完成此操作，只需对服务器程序进行适当修改即可。

一种是在服务器本身中实现重启能力，例如在接收到特定信号或其他消息时。然后，程序将执行其新版本，将侦听套接字的文件描述符号传递给它，例如作为参数。此套接字将具有 FD_CLOEXEC清除标志（默认）以便继承它。由于其他套接字将继续由原始进程提供服务，并且不应传递给新进程，因此应在这些套接字上设置标志，例如使用 fcntl()。在分叉并执行新进程后，原始进程可以继续并关闭侦听套接字，而不会中断服务，因为新进程现在正在侦听该套接字。

如果您不希望旧服务器必须分叉并执行新服务器本身，另一种方法是使用 Unix 域套接字用于在新旧服务器进程之间进行通信。新的服务器进程在启动时可以在文件系统中的已知位置检查此类套接字。如果存在，新服务器将连接到此套接字并请求旧服务器使用 SCM_RIGHTS 将其侦听套接字作为辅助数据传输。 cmsg 末尾给出了一个示例(3)。