Grep 正则表达式无法与 Windows 上的 Cygwin 一起使用

发布于 2024-12-02 02:16:13 字数 259 浏览 0 评论 0原文

我正在尝试查找所有非使用 grep 在文件中显示 ascii 字符：

grep '[^\x00-\x7F]' myfile

我认为这应该有效，但它返回文件中的每一行。

有什么想法吗？

原文

I'm trying to find all non ascii chars in a file using grep:

grep '[^\x00-\x7F]' myfile

I think this should work but it returns each row in the file.

Any ideas?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

北凤男飞 2024-12-09 02:16:13

grep 无法识别 \x 语法。

( echo Hello ; echo '\\x48' ) | grep '\x48'

打印

\x48

（'H' 是字符 0x48。）

您的 grep 匹配所有行，因为每行都包含 \、以外的字符x、0、7、F 以及 0 范围内的任何内容 .. \。

请注意，这并非特定于 Cygwin。

GNU grep（Cygwin 拥有的）有一个实验性的 -P 选项，告诉它使用类似 Perl 的正则表达式；使用该选项，它确实可以识别 \x 语法。

grep doesn't recognize the \x syntax.

( echo Hello ; echo '\\x48' ) | grep '\x48'

prints

\x48

('H' is character 0x48.)

Your grep is matching all lines because each line contains a character other than \, x, 0, 7, F, and anything in the range 0 .. \.

Note that this is not specific to Cygwin.

GNU grep (which is what Cygwin has) has an experimental -P option that tells it to use Perl-like regular expressions; with that option, it does recognize the \x syntax.

回复收藏 0 原文

指尖上得阳光 2024-12-09 02:16:13

发现perl可以工作：

perl -n -e 'print if /[^\x00-\x7F]/' file

回复收藏 0 原文

伤感在游骋 2024-12-09 02:16:13

Grep 可能会将多字节（即非 ASCII）字符解释为几个单字节（ASCII）字符。（这样，这个可爱的 ∩ 字符 [U+2229] 将显示为 " [U+0022] 后跟一个 ） [U +0029]。）您需要弄清楚文件的编码并使用了解 Unicode 的更复杂的系统。

回复收藏 0 原文

~没有更多了~

关于作者

雨落□心尘

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

Grep 正则表达式无法与 Windows 上的 Cygwin 一起使用

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

Grep 正则表达式无法与 Windows 上的 Cygwin 一起使用

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。