搜索文件中不包括一组字符的字符
我有一个包含 130 万行和 258 列的文本文件,以分号 (;) 分隔。如何搜索文件中的字符,不包括字母表字母(大写和小写)、分号 (;)、引号 (') 和双引号 (")?理想情况下,结果应为非重复的列表。
I have a text file with 1.3million rows and 258 columns delimited by semicolons (;). How can I search for what characters are in the file, excluding letters of the alphabet (both upper and lower case), semicolon (;), quote (') and double quote (")? Ideally the results should be in a non-duplicated list.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
使用以下管道
示例
Use the following pipeline
Example
您可以使用 grep -v 命令并将其通过管道进行排序,然后传输到 uniq。
you can use grep -v command and pipe it to sort and then to uniq.