如何检测无效的 fd/句柄

发布于 2024-12-17 09:26:59 字数 543 浏览 4 评论 0原文

我有一个服务器应用程序，它使用异步 I/O 处理网络客户端。客户端连接被接受，然后添加到描述符集中，可以使用 poll/epoll/select/etc 来监视该描述符集。我正在使用 apr_pollset_poll() apache APR 库调用来检查可以读取或写入的描述符。这在内部使用 epoll/poll/select/etc，具体取决于平台。

问题是，不知何故，套接字描述符之一被损坏，并且 apr_pollset_poll 返回 errno 10038，即 WSAENOTSOCK：尝试对非套接字的内容进行操作。不幸的是，这导致我的应用程序完全停止工作，而不仅仅是能够踢出特定的客户端连接。如果我可以以某种方式忽略或从描述符集中删除此套接字，那么它可以继续运行并正确读取/写入其他套接字。我知道我应该找到导致套接字损坏的根本原因，但我需要一个故障安全解决方法。

一旦描述符被添加到轮询集中，这些描述符就会由操作系统/内核处理，我看不出有什么方法可以检索它们以进行迭代。在我自己的列表中维护这些可能会进一步产生其他问题，因为在套接字关闭时，我需要以某种方式清理它们，这对于内核轮询集会自动发生。

有什么建议吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我的影子我的梦 2024-12-24 09:26:59

这听起来很可怕，但一旦发生就是紧急情况。因此，我建议检查工作轮询集中的所有描述符，并尝试对该描述符执行操作，如果描述符是假的，则会触发该错误。例如，您可以创建一个新的临时轮询集并尝试非阻塞零超时轮询操作，然后查看是否可以收到错误。

如果您的民意调查集中有超过十几个描述符，您可能会考虑使用二分搜索而不是一次一个的方法。您可以将一半的描述符放入临时轮询集中，然后执行操作。如果失败，您就知道在您尝试的集合中有一个伪造的描述符；分成两部分并重试；如果它没有失败，您可以假设伪造的描述符位于另一组中，并且您可以验证另一半失败或假设它会失败并将其余部分分成两部分，然后重试。继续下去，直到隔离出一个失败的描述符。显然，如果您有多个虚假描述符而不仅仅是一个，则可能需要重复该过程几次。

隔离一个描述符后，您就可以决定需要对它做什么以及如何做。如果/当问题再次出现时，您可以重复隔离过程。显然，除非您首先发现问题，否则您不会尝试此操作。但是，当出现问题时，您需要隔离问题，这将（应该）实现这一目标。

回复收藏 0 原文