当前位置：文江博客话题详情

正则表达式等价

发布于 2024-07-13 15:26:50 字数 63 浏览 6 评论 0原文

有没有办法找出两个任意正则表达式是否等价？对我来说看起来很复杂的问题，但可能有一些 DFA 简化机制之类的？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

離人涙 2024-07-20 15:26:50

要测试等价性，您可以计算表达式的最小 DFA，比较它们。

回复收藏 0 原文

酒浓于脸红 2024-07-20 15:26:50

等式的可测试性是正则表达式的经典属性之一。（注意，如果您真正谈论的是 Perl 正则表达式或其他一些技术上非正则超级语言，则这并不成立。）

将您的 RE 转换为广义有限自动机 A 和 B，然后构造一个新的自动机 AB，例如A 的接受状态到 B 的起始状态有空转换，并且 B 的接受状态被反转。这给你一个自动机，它接受 A 接受的所有字符串，B 接受的所有字符串除外。

对 BA 执行相同的操作，并将两者都简化为纯 FA。如果 FA 没有可从起始状态访问的接受状态，则它接受空语言。如果你能证明 AB 和 BA 都是空的，那么你就证明了 A = B。

编辑 嘿，我不敢相信没有人注意到那里的巨大错误 - 一个故意的错误course :-p

所描述的自动机 AB 将接受前半部分被 A 接受而后半部分不被 B 接受的字符串。构建所需的 AB 是一个稍微棘手的过程。我无法立即想到它，但我确实知道它是明确定义的（并且可能涉及创建状态来表示 A 中接受状态和 B 中不接受状态的产物）。

回复收藏 0 原文

难以启齿的温柔 2024-07-20 15:26:50

这实际上取决于您所说的正则表达式的含义。正如其他发帖者指出的那样，将两个表达式减少到最小 DFA 应该可行，但它仅适用于纯正则表达式。

现实世界的正则表达式库中使用的一些构造（特别是反向引用）使它们能够表达不规则的语言，因此 DFA 算法不适用于它们。例如，正则表达式：([az]*) \1 匹配由空格分隔的同一单词的两次出现（a a 和 b b但不是 b a 也不是 a b）。有限自动机根本无法识别这一点。

回复收藏 0 原文

凉栀 2024-07-20 15:26:50

这两个 Perlmonks 线程讨论了这个问题（具体来说，请阅读 blokhead 的回复）：

回复收藏 0 原文

~没有更多了~

关于作者

拔了角的鹿

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

正则表达式等价

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

正则表达式等价

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

胡图图

zt006

z祗昰~

冰葑

野の

天空

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。