当执行fork()函数的时候,到底发生了什么
fork函数是unix系统中实现多进程的一个基本函数,它看起来非常特殊。首先它创建了一个或多个自身进程的自进程,并且继承了当前进程的上下文资源。
这一个过程具体是怎么完成的?它是如何做到多个进程同时监听一个资源的,比如有一个tcp连接进来,那么到底应该是哪个子进程去响应这个请求呢?如果子进程再次fork自己会发生什么,可以不停这样下去吗?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
先说一下fork,fork会生成一个和当前进程相同的副本,称为子进程。原进程的所有资源都以适当的方式复制到子进程,因此该系统调用之后,原来的进程就有了两个独立的实例。这两个实例的联系包括:同一组打开文件、同样的工作目录、内存中同样的数据(两个进程各有一份副本)。当然Linux使用了copy on write,也就是说只有新的进程对内存页执行write操作的时候才会复制内存页面。
具体如何完成:
首先要了解一下
task_struct
这个数据结构。Linux内核很多涉及进程的部分都围绕这个数据结构(数据结构定义在include/sched.h中,有兴趣去看一下)。数据结构里面的成员非常多,下面会按照几个部分介绍一下。fork之后,操作系统会copy当前进程的
task_struct
机构体,除了id号不一样之外,其余完全一样。fork之后如果没有调用exec()
,那么仅仅只是生成多个当前的进程,提升并发的能力,比如说nginx。nginx的进程都是master进程fork
出来的,所以他们有相同的监听句柄。至于是哪个worker进程去响应,nginx有自己的竞争方式。最后关于子进程fork自己会发生什么。请看下图:
linux启动时候只有一个init进程,剩下的题主自行理解。
fork并不算是基本函数,它调用的clone,而clone函数有参数可以进行更灵活的配置。
其实主要就这三个区别:
1.fork之后父子进程将共享代码文本段,但是各自拥有不同的栈段、数据段及堆段拷贝。子进程的栈、数据从fork一瞬间开始是对于父进程的完全拷贝、每个进程可以更改自己的数据,而不要担心相互影响!
2.fork之后父子进程同时开始从fork点向下执行代码,具体fork之后CPU会调度到谁?不一定!
3.执行fork之后,子进程将拷贝父进程的文件描述符副本,指向同一个文件句柄(包含了当前文件读写的偏移量等信息)。
《UNIX系统编程》第24章进程的创建讲的也非常清楚,这本书也非常推荐读,时间驱动也讲的很好。
https://www.cnblogs.com/zhaoy... 这篇文章是一个朋友写的,对fork的理解也很到位
《UNIX系统编程》《The Linux Programming Interface》的pdf版本在他的博客也下载