Linux 多播 sendto() 性能因本地侦听器而降低

发布于 2024-11-26 18:42:00 字数 543 浏览 4 评论 0原文

我们有一个“发布者”应用程序，它使用多播发送数据。该应用程序对性能极其敏感（我们正在微秒级进行优化）。侦听此已发布数据的应用程序可以（并且通常）与发布应用程序位于同一台计算机上。

我们最近注意到一个有趣的现象：执行 sendto() 的时间与机器上侦听器的数量成比例增加。

例如，假设没有侦听器，sendto() 调用的基本时间为 5 微秒。每个额外的侦听器都会使 sendto() 调用的时间增加大约 2 微秒。因此，如果我们有 10 个侦听器，那么现在 sendto() 调用需要 2*10+5 = 25 微秒。

对我来说，这表明 sendto() 调用会阻塞，直到数据被复制到每个侦听器为止。

对听方的分析也支持这一点。如果有 10 个侦听器，每个侦听器都会比前一个侦听器晚两微秒接收数据。（即，第一个侦听器在大约 5 微秒内获取数据，最后一个侦听器在大约 23--25 微秒内获取数据。）

有没有办法在编程级别或系统级别更改此行为？像非阻塞/异步 sendto() 调用之类的东西？或者至少只阻塞直到消息被复制到内核内存中，这样它就可以返回而无需等待所有侦听器）？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

以酷 2024-12-03 18:42:00

多播循环的效率极其低下，不应该用于高性能消息传递。正如您所注意到的，对于每次发送，内核都会将消息复制到每个本地侦听器。

推荐的方法是使用单独的 IPC 方法来分发到同一主机上的其他线程和进程，无论是共享内存还是 unix 套接字。

例如，可以使用 ZeroMQ 套接字轻松实现这一点，方法是在同一 ZeroMQ 套接字上的 PGM 多播连接之上添加 IPC 连接。

回复收藏 0 原文

去了角落 2024-12-03 18:42:00

很抱歉问了一个显而易见的问题，但是套接字是非阻塞的吗？（将 O_NONBLOCK 添加到端口标志集 - 请参阅 fcntl）

回复收藏 0 原文

~没有更多了~

关于作者

送舟行

暂无简介

文章

25 人气

关注发私信

知足的幸福

文章 0 评论 0

关注

我一向站在原地

文章 0 评论 0

关注

慕烟庭风

文章 0 评论 0

关注

秉忠贞之诚守退让之实

文章 0 评论 0

关注

小兔几

文章 0 评论 0

关注

mb_3y7WUgWY

文章 0 评论 0

友情链接

文江博客

Linux 多播 sendto() 性能因本地侦听器而降低

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签