关于Linux管道实现的问题
求教一下一个关于Linux管道的问题
例如 cat a.log | head 这条命令
如果a.log 大小为1T,那么这条命令是怎么执行的?
head打印出头十行之后,cat这个程序是怎么执行的?
未写入管道的数据去了哪里?cat是怎么结束的?是怎么实现的?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
这实际跟你所用的 shell 有关,拿常用的 bash 来说:
cat a.log
,开另外一个进程 2 运行head
,并创建一个无名管道,将 1 的标准输出重定向给管道的 写端,将 2 的标准输入重定向到管道的读端;shell 会等待所有命令执行完才返回。建议你看看
/proc/${pid}/
文件夹下的内容就明白了,你就立刻会对linux的管道实现有一个更明确的认识。你启动程序之后,想办法抓一下你的pid(比如另开一个终端使用
ps aux | grep
的方式),然后去对应pid下的文件夹,就能看到管道是怎么实现这个操作的了。管道的设计就是最基本的流式处理,你看看目前比较流行的流式处理框架,基本都借鉴了管道的设计思想
Linux pipe 是通过缓存 buffer 实现的. 和现实的管道也很相似,FIFO 模式,先进的先出, 管道本身有一定的容积, 在缓存未满时,读写都不受影响, 但 buffer 满时, 写便会阻塞. 直到空出地方再次可以写才行. 但 buffer 大小又与系统实现有关, 不同系统也不一样, 同一系统也可能动态变化.
bash下可以通过下面的脚本测试 buffer 大小