在 awk 中查找两行中的唯一项
以下脚本给出了第四个字段中唯一元素的数量。
awk -F'\t' '$7 ~ /ECK/ {print $4}' filename.txt | sort | uniq | wc -l
同样,我可以在第二个字段中找到独特的元素。但是我如何计算第四个字段中但不在第二个字段中的唯一项目的数量。换句话说,第四个字段中的唯一元素不会出现在第二个字段中。
The following script gives me the number of unique elements in 4th field.
awk -F'\t' '$7 ~ /ECK/ {print $4}' filename.txt | sort | uniq | wc -l
Similarly I can find the unique elements in 2nd Field. But how do I calculate the number of unique items that are in 4th field but not in the second field. In other words, the unique elements in 4th field that do not appear in the 2nd field.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
你可以在 awk 中完成这一切
You can do it all in awk
这使用 Bash(或 ksh 或 zsh)进程替换,但如果您使用不支持该功能的 shell,则可以创建已排序的临时文件。
This uses Bash (or ksh or zsh) process substitution, but you could create temporary files that are sorted if you're using a shell that doesn't support that.