如果使用共享内存，进程相对于线程还有优势吗？

发布于 2024-10-11 17:08:35 字数 719 浏览 4 评论 0原文

我编写了一个 Linux 应用程序，其中主“消费者”进程分叉出一堆“读取器”进程（~16），这些进程从磁盘读取数据并将其传递给“消费者”进行显示。数据通过在分叉之前使用套接字对创建的套接字传递。

我最初使用此进程边界编写它有 3 个原因：

消费者进程具有实时约束，因此我想避免消费者中的任何内存分配。读者可以自由地按照自己的意愿分配内存，甚至可以用另一种语言编写（例如，通过垃圾收集），并且这不会中断具有 FIFO 优先级的消费者。此外，读取器进程中的磁盘访问或其他 IO 不会中断消费者。我认为使用线程我无法获得这样的保证。
使用进程会阻止我这个程序员做一些愚蠢的事情，比如使用全局变量和破坏其他进程的内存。
我认为分叉一批工作人员将是利用多 CPU 架构的最佳方式，而且我认为使用进程而不是线程通常会更安全。

并非所有读取器都始终处于活动状态，但是，那些处于活动状态的读取器会不断发送大量数据。最近我在想，要通过避免与写入和读取套接字相关的内存复制来优化这一点，最好将数据直接读入共享内存缓冲区（shm_open/mmap）。然后，只有该共享内存的索引才会通过套接字传递，消费者将直接从中读取数据，然后再将其标记为可用。

无论如何，进程相对于线程的最大好处之一是避免破坏另一个线程的内存空间。您认为切换到共享内存会破坏我在此架构中拥有的任何优势吗？在这种情况下使用进程是否仍然有任何优势，或者我应该将我的应用程序切换为使用线程？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我不会写诗 2024-10-18 17:08:35

您认为线程无法满足实时约束的假设是错误的。只要消费者线程本身不使用 malloc（这当然可能导致锁争用），读取器线程中的 IO 或内存分配就无法阻止消费者线程。如果你不确定。

至于使用进程而不是线程的其他原因（安全性、用不同语言编写读者的可能性等），这些都是完全合法的。只要您的消费者进程将共享内存缓冲区视为潜在不安全的外部数据，我认为您不会因为从管道切换到共享内存而失去任何显着的安全性。

回复收藏 0 原文

遥远的绿洲 2024-10-18 17:08:35

是的，正是因为你所说的原因。最好保护每个进程的内存，并且只共享真正需要共享的内容。因此每个消费者都可以分配和使用其资源，而无需担心锁定。

至于任务之间的索引通信，应该注意的是，您可以使用共享内存中的一个区域，并使用互斥体进行访问，因为它可能比套接字通信轻。仅当存在争用时，文件描述符通信（套接字、管道、文件等）始终涉及内核、具有互斥锁或信号量的共享内存。

在多处理器环境中使用共享内存进行编程时需要注意的一点是避免对变量的错误依赖。当两个不相关的对象共享同一缓存行时，就会发生这种情况。当一个对象被修改时，它也会“弄脏”另一个对象，这意味着如果其他处理器访问另一个对象，它将触发 CPU 之间的缓存同步。这可能会导致缩放效果不佳。通过将对象与缓存行大小（通常为 64 字节，但不同架构可能有所不同）对齐，可以轻松避免这种情况。

回复收藏 0 原文

挽清梦 2024-10-18 17:08:35

根据我的经验，我遇到的用线程代替进程的主要原因是效率。
如果您的进程使用大量可以在多线程中共享的代码或非共享内存，那么您可以在高线程 CPU（例如每个 CPU 具有 64 个或更多线程的 SUN Sparc CPU）上获得大量性能。在这种情况下，CPU 缓存（尤其是代码缓存）在多线程进程中会更加高效（Sparc 上的缓存很小）。

如果您发现您的软件在具有更多 CPU 线程的新硬件上运行时运行速度并不快，那么您应该考虑多线程。否则，你为避免这种情况而提出的论点对我来说似乎很好。

我还没有在英特尔处理器上遇到这个问题，但将来当他们为每个 CPU 添加更多内核时，它可能会发生。

回复收藏 0 原文

~没有更多了~