Python 或命令行实用程序 - 排序和过滤文件?
给定以下形式的数据:
a b 1.1
c d 2.3
b a 1.1
是否可以根据第三列对此类文件进行排序,并删除第三列中重复条目的行,以便输出为:
a b 1.1
c d 2.3
或,
c d 2.3
b a 1.1
。
我能够仅使用 python、R 或命令行实用程序对一组非常大的文件执行此任务。
谢谢!
Given data of the form:
a b 1.1
c d 2.3
b a 1.1
Is it possible to sort such a file based on the thired column and remove lines where the entry in the third column is duplicated, such that the output will be:
a b 1.1
c d 2.3
or,
c d 2.3
b a 1.1
.
I am capable of using only python, R or command line utilities to perform this task on a set of very large files.
Thanks!
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
Unix
sort
应该能够为你完成这项工作:Unix
sort
should be able to do the work for you: