文章来源于网络收集而来，版权归原创者所有，如有侵权请及时联系！

9.3 多进程

发布于 2024-01-25 22:02:55 字数 1972 浏览 0 评论 0 收藏 0

由于GIL，一个基于线程的Python程序永远只能一次使用一个处理器的时间。写本地Python程序做并发处理时，这样很让人焦急。历史上，人们使用过一些临时的解决方案，比如开多个Python进程，通过文件系统进行通信等。

从版本2.6开始，Python包含了一个入门级的并发处理模块multiprocessing。它以类似线程的方式管理多个Python进程。

HDF5也可以使用multiprocessing，不过需要记住一些注意事项。最重要的是记住新进程继承了来自父进程的HDF5库的状态。一种很常见的情况是多个进程为了一个打开的文件互相竞争。在本书写作时（2013年8月），这种情况甚至会发生在只读的文件上，这跟multiprocessing的实现细节有关，它的实现基于Linux/Unix操作系统的fork()系统调用。HDF组织已经意识到了这个限制，你可以检查h5py/PyTables的最新文档看看该限制是否已经被解决了。

同时，为了避免问题，这里有一些预防手段：

1．仅在主进程里进行文件I/O，且不要在文件打开时使用multiprocessing功能。

2．多个子进程可以安全地读取同一个文件；但文件必须在新进程创建以后打开。

3．让每个子进程写入不同的文件，在结束时合并它们。

图9-2显示了流程（1）。初始的进程负责文件I/O，并通过queue以及其他multiprocessing组件跟子进程通信。