sed/awk +正则表达式删除第一个字段匹配的重复行（IP地址）

发布于 2025-01-05 12:06:35 字数 368 浏览 2 评论 0原文

我需要一个解决方案来删除第一个字段是 IPv4 地址的重复行。例如，我在文件中有以下几行：

192.168.0.1/text1/text2
192.168.0.18/text03/text7
192.168.0.15/sometext/sometext
192.168.0.1/text100/ntext
192.168.0.23/othertext/sometext

因此，在前面的场景中它匹配的所有内容都是 IP 地址。我所知道的是，IP 地址的正则表达式是：

\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b

如果解决方案是一行且尽可能快，那就太好了。

原文

I need a solution to delete duplicate lines where first field is an IPv4 address.For example I have the following lines in a file:

192.168.0.1/text1/text2
192.168.0.18/text03/text7
192.168.0.15/sometext/sometext
192.168.0.1/text100/ntext
192.168.0.23/othertext/sometext

So all it matches in the previous scenario is the IP address. All I know is that the regex for IP address is:

\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b

It would be nice if the solution is one line and as fast as possible.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

摇划花蜜的午后 2025-01-12 12:06:35

如果文件仅以您显示的格式包含行，即第一个字段始终是IP地址，则您可以使用1行awk：

awk '!x[$1]++' FS="/" $PATH_TO_FILE

编辑：这将删除基于仅的重复项关于 IP 地址。我不确定这是我写这个答案时OP想要的。

If, the file contains lines only in the format you show, i.e. first field is always IP address, you can get away with 1 line of awk:

awk '!x[$1]++' FS="/" $PATH_TO_FILE

EDIT: This removes duplicates based only on IP address. I'm not sure this is what the OP wanted when I wrote this answer.

回复收藏 0 原文

冷心人i 2025-01-12 12:06:35

如果您不需要保留原始顺序，一种方法是使用 sort：

sort -u <file>

If you don't need to preserve the original ordering, one way to do this is using sort:

sort -u <file>

回复收藏 0 原文

断桥再见 2025-01-12 12:06:35

ArjunShankar 发布的 awk 对我来说创造了奇迹。

我有一个巨大的项目列表，其中字段 1 中有多个副本，字段 2 中有一个特殊的序列号。我需要每个唯一字段 1 中的“最新”或最高序列号。

我必须使用 sort -rn 来推送它们直到“第一个条目”位置，因为第一步是写入，然后比较下一个条目，而不是获取列表中的最后一个/最近的条目。

感谢阿琼·香卡！

回复收藏 0 原文

~没有更多了~

关于作者

叶落知秋

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

sed/awk +正则表达式删除第一个字段匹配的重复行（IP地址）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

sed/awk +正则表达式删除第一个字段匹配的重复行（IP地址）

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。