unix中sort命令的性能
我正在为我的公司编写一个自定义 apache 日志解析器,我注意到一个我无法解释的性能问题。我有一个大小为 1.2GB 的文本文件 log.txt。
命令:sort log.txt 比命令:cat log.txt | 慢最多 3 秒 有人知道为什么
会发生这种情况吗?
I am writing a custom apache log parser for my company and I noticed a performance issue that I can't explain. I have a text file log.txt with size 1.2GB.
The command: sort log.txt is up to 3 sec slower than the command: cat log.txt | sort
Does anybody know why this is happening?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
cat 文件 | sort 是对 Cat 的无用使用。
应该不会需要更长的时间。你确定你的时间安排正确吗?
请发布以下输出:
并且
您需要运行命令几次并获取平均值。
cat file | sort
is a Useless Use of Cat.It shouldn't take longer. Are you sure your timings are right?
Please post the output of:
and
You need to run the commands a few times and get the average.
您不必担心
sort
的性能,而是应该更改日志记录:另外,您确定 cat 正在读取整个文件吗?它可能有一个读缓冲区等。
Instead of worrying about the performance of
sort
instead you should change your logging:Also, are you sure cat is reading the entire file? It may have a read buffer etc.