搜索文件中不包括一组字符的字符

发布于 2024-12-10 22:20:33 字数 111 浏览 0 评论 0原文

我有一个包含 130 万行和 258 列的文本文件,以分号 (;) 分隔。如何搜索文件中的字符,不包括字母表字母(大写和小写)、分号 (;)、引号 (') 和双引号 (")?理想情况下,结果应为非重复的列表。

I have a text file with 1.3million rows and 258 columns delimited by semicolons (;). How can I search for what characters are in the file, excluding letters of the alphabet (both upper and lower case), semicolon (;), quote (') and double quote (")? Ideally the results should be in a non-duplicated list.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

醉酒的小男人 2024-12-17 22:20:33

使用以下管道

# Remove the characters you want to exclude
tr -d 'A-Za-z;"'\' <file |
# One character on each line
sed 's/\(.\)/\1\
/g' | 
# Remove duplicates
sort -u

示例

echo '2343abc34;ABC;;@$%"' | 
tr -d 'A-Za-z;"'\' |
sed 's/\(.\)/\1\
/g' | 
sort -u

$
%
2
3
4
@

Use the following pipeline

# Remove the characters you want to exclude
tr -d 'A-Za-z;"'\' <file |
# One character on each line
sed 's/\(.\)/\1\
/g' | 
# Remove duplicates
sort -u

Example

echo '2343abc34;ABC;;@$%"' | 
tr -d 'A-Za-z;"'\' |
sed 's/\(.\)/\1\
/g' | 
sort -u

$
%
2
3
4
@
荒人说梦 2024-12-17 22:20:33

您可以使用 grep -v 命令并将其通过管道进行排序,然后传输到 uniq。

you can use grep -v command and pipe it to sort and then to uniq.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文