最小化 Java 线程上下文切换开销

发布于 2024-09-03 15:05:00 字数 324 浏览 7 评论 0原文

我有一个 Java 应用程序在 Sun 1.6 32 位 VM/Solaris 10 (x86)/Nahelem 8 核（每核 2 个线程）上运行。

应用程序中的一个特定用例是响应某些外部消息。在我的性能测试环境中，当我在接收外部输入的同一线程中准备和发送响应时，与将消息交给单独的线程来发送响应相比，我获得了大约 50 us 的优势。我使用带有 SynchronousQueue 的 ThreadPoolExecutor 来进行切换。

根据您的经验，将任务调度到线程池与获取执行之间的~~可接受的~~预期延迟是多少？过去有哪些想法对您有用，可以尝试改进这一点？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

一直在等你来 2024-09-10 15:05:00

“可接受的延迟”完全取决于您的应用程序。如果您有非常严格的延迟要求，那么在同一线程上处理所有内容确实会有所帮助。幸运的是，大多数应用程序没有那么严格的要求。

当然，如果只有一个线程能够接收请求，那么占用该线程来计算响应将意味着您无法接受任何其他请求。根据您正在做的事情，您可以使用异步 IO （等）来避免“每个请求线程”模型，但在我看来，这要困难得多，并且仍然会导致线程上下文切换。

有时，对请求进行排队以避免有太多线程处理它们是适当的：如果您的处理受 CPU 限制，那么拥有数百个线程没有多大意义 - 最好有一个任务的生产者/消费者队列并将它们分发到每个核心大约一个线程。当然，如果您设置正确，这基本上就是 ThreadPoolExecutor 将会做的事情。如果您的请求花费大量时间等待外部服务（包括磁盘，但主要是其他网络服务），那么这种方法就不太有效……那时您要么需要使用异步执行模型，要么每当您可能需要使用异步执行模型通过阻塞调用使核心空闲，或者您进行线程上下文切换并拥有大量线程，依靠线程调度程序使其工作得足够好。

最重要的是，延迟要求可能很严格 - 根据我的经验，它们比吞吐量要求要严格得多，因为它们更难以横向扩展。但这确实取决于上下文。

回复收藏 0 原文

椒妓 2024-09-10 15:05:00

对于切换来说 50us 听起来有点高，IME (Solaris 10/Opteron) LBQ 通常在 30-35us 范围内，而 LTQ (LinkedTransferQueue) 大约比这快 5us。正如其他回复中所述，SynchronousQueue 可能会稍微慢一些，因为在另一个线程占用之前优惠不会返回。

根据我的结果，Solaris 10 明显比 Linux 慢，时间 <10us。

这实际上取决于一些事情，在峰值负载下，