低延迟网络技术和灵丹妙药

发布于 2024-11-08 12:54:24 字数 751 浏览 3 评论 0原文

在对低延迟网络进行一些基本的谷歌搜索之后，我列出了程序员和系统设计人员在开始低延迟网络时应考虑的事项列表：

硬件、系统和协议的设计必须一起考虑
使用 UDP 而不是 TCP 开发协议，并在应用层实现简单的 ack-nak、重发逻辑
减少消耗和打包离线数据的进程或线程的上下文切换数量（最好为零）
使用操作系统的最佳选择器（select、kqueue、epoll 等）
使用具有大量板载缓冲区 (fifo) 的优质网卡和交换机
使用多个 NIC，专门用于下行和上行数据流
减少其他设备或软件生成的 IRQ 数量（简而言之，如果不需要，请将其删除）
减少互斥体和条件的使用。相反，在可能的情况下使用无锁编程技术。利用该架构的 CAS 功能。（无锁容器）
考虑单线程而不是多线程设计 - 上下文切换非常昂贵。
了解并正确利用架构的缓存系统（L1/L2、RAM 等）
更喜欢完全控制内存管理，而不是比委托给垃圾收集器
使用优质电缆，使电缆尽可能短，减少扭曲和卷曲的次数

我的问题：我想知道SOers们认为在开始低延迟网络时还有哪些重要的事情。

请随意批评上述任何一点

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

执手闯天涯 2024-11-15 12:54:24

电缆质量通常是一种转移注意力的因素。我会更多地考虑连接网络分析仪，看看是否有足够的重传值得关注。如果出现很多问题，请尝试隔离发生问题的位置，并更换导致问题的电缆。如果您没有收到导致重新传输的错误，则电缆（实际上）对延迟没有影响。

NIC 和（尤其是）交换机上的大缓冲区本身不会减少延迟。事实上，为了真正最小化延迟，您通常希望使用尽可能小的缓冲区，而不是更大的缓冲区。位于缓冲区中而不是立即处理的数据会增加延迟。说实话，这很少值得担心，但仍然如此。如果您真的想要最大限度地减少延迟（并且不太关心带宽），那么最好使用集线器而不是交换机（有点难以找到，但只要满足以下条件，延迟肯定很低）网络拥塞足够低）。

多个 NIC 可以极大地提高带宽，但它们对延迟的影响通常非常小。

编辑：然而，我的主要建议是了解规模。将网络电缆减少一英尺可以节省大约一纳秒——与通过几个汇编语言指令加速数据包处理的一般顺序相同。

底线：与任何其他优化一样，要取得更大的成果，您需要先测量延迟的位置，然后才能采取措施减少延迟。在大多数情况下，减少电线长度（举一个例子）不会产生足够明显的差异，仅仅是因为它一开始就很快。如果某件事一开始需要 10 微秒，那么您所做的任何事情都无法使其速度超过 10 微秒，因此，除非您的事情快到 10 微秒占您时间的很大一部分，否则不值得攻击。

回复收藏 0 原文

落花浅忆 2024-11-15 12:54:24

其他：

1：使用用户层网络堆栈

2：在与处理代码相同的套接字上提供服务中断（共享缓存）

3：更喜欢固定长度协议，即使它们的字节稍大（更快的解析）

4：忽略网络字节顺序约定并仅使用本机排序

5：从不在例程和对象池中分配（尤其是垃圾收集语言）

6：尝试尽可能防止字节复制（在 TCP 发送中很难）

7：使用直通切换模式

8：破解网络堆栈以删除 TCP 慢启动

9：通告一个巨大的 TCP 窗口（但不要使用它），以便另一方可以同时拥有大量正在传输的数据包

10：关闭 NIC 合并，特别是对于发送（如果需要，请在应用程序堆栈中打包）

11：更喜欢铜而不是光纤

我可以继续，但这应该让人们思考

我不同意的一个：

1：网络电缆很少成为问题，除非坏了（有是一个例外就电缆类型而言）

回复收藏 0 原文

岁月苍老的讽刺 2024-11-15 12:54:24

这可能有点明显，但这是一种我很满意的技术，它适用于 UDP 和 TCP，所以我将写一下它：

1) 永远不要对大量传出数据进行排队：具体来说，尽量避免将内存中的数据结构编组到序列化字节缓冲区中，直到最后一刻。相反，当您的发送套接字 select() 为可写状态时，将当时相关/脏数据结构的当前状态展平，并立即 send() 将它们输出。这样数据就永远不会在发送端“堆积”。（另外，请确保将套接字的 SO_SNDBUF 设置为尽可能小，以最大程度地减少内核内的数据排队）

2）您可以在接收端执行类似的操作，假设您的数据以某种方式键入：您可以读取所有可用的数据消息并将它们放入键控数据结构（例如哈希表）中，而不是执行（读取数据消息，处理数据消息，重复）循环，直到套接字没有更多数据可供读取，然后（并且只有那时）迭代数据结构并处理数据。这样做的优点是，如果您的接收客户端必须对接收到的数据进行任何重要的处理，那么过时的传入消息将被自动/隐式丢弃（因为它们的替换会在密钥数据结构中覆盖它们），因此传入的数据包将获胜不会备份到内核的传入消息队列中。（当然，您可以让内核的队列填满并丢弃数据包，但是您的程序最终会读取“旧”数据包并丢弃“新”数据包，这通常不是您想要的）。作为进一步的优化，您可以让 I/O 线程将键控数据结构移交给单独的处理线程，以便 I/O 不会因处理而被推迟。

回复收藏 0 原文

~没有更多了~