使用 shell 脚本比较两个列表

发布于 2024-08-09 06:32:42 字数 133 浏览 1 评论 0原文

假设我在文件 f1、f2 中有两个数字列表，每个数字每行一个。我想看看第一个列表中有多少数字不在第二个列表中，反之亦然。目前我正在使用 grep -f f2 -v f1，然后使用 shell 脚本重复此操作。这非常慢（平方时间很痛苦）。有更好的方法吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

逆光下的微笑 2024-08-16 06:32:42

我喜欢用“comm”来形容这类事情。
（文件需要排序。）

$ cat f1
1
2
3
$ cat f2
1
4
5
$ comm f1 f2
        1
2
3
    4
    5
$ comm -12 f1 f2
1
$ comm -23 f1 f2
2
3
$ comm -13 f1 f2
4
5
$

I like 'comm' for this sort of thing.
(files need to be sorted.)

$ cat f1
1
2
3
$ cat f2
1
4
5
$ comm f1 f2
        1
2
3
    4
    5
$ comm -12 f1 f2
1
$ comm -23 f1 f2
2
3
$ comm -13 f1 f2
4
5
$

回复收藏 0 原文

指尖凝香 2024-08-16 06:32:42

难道您不能将每个数字放在一行中，然后对它们进行 diff(1) 吗？您可能需要事先对列表进行排序，但要使其正常工作。

回复收藏 0 原文

紙鸢 2024-08-16 06:32:42

在特殊情况下，一个文件是另一个文件的子集，以下内容：

cat f1 f2 | sort | uniq -u

将仅列出较大文件中的行。当然，通过管道传输到 wc -l 将显示计数。

然而，这并不完全是你所描述的。

这个单行经常满足我的特殊需求，但我希望看到一个更通用的解决方案。

In the special case where one file is a subset of the other, the following:

cat f1 f2 | sort | uniq -u

would list the lines only in the larger file. And of course piping to wc -l will show the count.

However, that isn't exactly what you described.

This one-liner serves my particular needs often, but I'd love to see a more general solution.

回复收藏 0 原文

~没有更多了~

关于作者

原来分手还会想你

暂无简介

0 文章

0 评论

23 人气

关注发私信

1CH1MKgiKxn9p

文章 0 评论 0

关注

ゞ记忆︶ㄣ

文章 0 评论 0

关注

JackDx

文章 0 评论 0

关注

信远

文章 0 评论 0

关注

yaoduoduo1995

文章 0 评论 0

关注

霞映澄塘

文章 0 评论 0

友情链接

文江博客

使用 shell 脚本比较两个列表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

使用 shell 脚本比较两个列表

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。