当前位置：文江博客话题详情

regex regular-language

正则表达式的威力有多大？

发布于 2024-09-24 15:01:18 字数 208 浏览 0 评论 0原文

顾名思义，我们可能认为正则表达式只能匹配正则语言。但是我们在实践中使用的正则表达式包含一些我不确定是否可以用理论对应物来实现的东西。例如，您将如何模拟反向引用？那么问题来了：我们在实践中使用的正则表达式的理论威力是什么？你能想出一种方法来匹配{(a^n)(b^n)|n>=0}吗？ {(a^n)(b^n)(c^n)|n>=0} 怎么样？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

琴流音 2024-10-01 15:01:19

您所暗示的正则表达式的基本困难是正则表达式没有“记忆”。在最纯粹的形式中，任何真正的正则表达式都不应该能够识别这两种语言中的任何一种。根据定义，任何可以解析此类语言的正则表达式都不是正则表达式。我认为你所说的“我们使用的正则表达式是练习”的意思是扩展正则表达式，这在技术上不是正则表达式。

你的问题的问题在于你要求将专门设计的理论场景应用于实际情况，这几乎总是以灾难告终。

所以我的答案有点不是答案，因为我是说你必须重新表述问题来询问扩展正则表达式才能得到答案。

一些可能对此事有所帮助的资源：

有用的维基百科文章

类似的 StackOverflow 问题

一本关于此主题的好书

我还将我的答案作为社区维基，供其他想要为这一思路做出贡献的人使用。

回复收藏 0 原文

小鸟爱天空丶 2024-10-01 15:01:18

您的问题的答案是，允许反向引用的“正则表达式”语言既不是常规的也不是上下文无关的。（换句话说，正如您所指出的，您无法使用常规语言或 CFL 来模拟反向引用。）事实上，维基百科表示我们在实践中使用的许多“正则表达式”语言都是 NP 完全：

无界模式匹配
反向引用的数量，如
在众多现代工具的支持下，
NP 完全（参见[11]定理 6.2）。

正如其他人所建议的，计算机语言和库中普遍支持的正则表达式语言与形式语言理论中的正则表达式是不同的。 Larry Wall 写了关于 Perl“正则表达式”，

“正则表达式”[...]仅
与真实常规有一定关系
表达式。尽管如此，该术语
随着我们的能力而成长
模式匹配引擎，所以我不是
将尝试与语言作斗争
这里有必要性。然而我会，
通常称它们为“正则表达式”

你问，

你能想出一个匹配的方法吗？
{(a^n)(b^n)|n>=0}？怎么样
{(a^n)(b^n)(c^n)|n>=0}？

我不确定您是否正在尝试测试理论正则表达式语言是否可以匹配“方块语言”，或者您是否正在寻找（实际）中的实现) 正则表达式 语言。这是前者不可能的证据；和这里有关于 java 正则表达式的后者的详细解释和实现。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

21 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

qq_FjTq5B

文章 0 评论 0

18273202778

文章 0 评论 0

WordPress小学生

文章 0 评论 0

〃温暖了心ぐ

文章 0 评论 0

迷乱花海

文章 0 评论 0

niuniu

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文