当前位置：文江博客话题详情

互斥的正则表达式

发布于 2024-09-03 17:22:32 字数 215 浏览 8 评论 0原文

如果我有一个正则表达式列表，是否有一种简单的方法可以确定它们中没有两个会返回同一字符串的匹配项？

也就是说，当且仅当对于所有字符串，列表中最多有一项与整个字符串匹配时，该列表才有效。

似乎很难（也许不可能？）明确地证明这一点，但我似乎找不到任何关于这个主题的工作。

我问的原因是我正在开发一种接受正则表达式的标记生成器，并且我想确保一次只有一个标记可以匹配输入的头部。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

初见 2024-09-10 17:22:32

如果您使用纯正则表达式（没有反向引用或其他使它们识别上下文无关或更复杂的语言的功能），那么您的要求是可能的。
您可以做的是将每个正则表达式转换为 DFA，然后（因为常规语言在交集下封闭）将它们组合成可识别的 DFA
两种语言的交集。如果该 DFA 具有从开始状态到接受状态的路径，则两个输入正则表达式都会接受该字符串。

问题在于，通常的 regex->DFA 算法的第一步是
将正则表达式转换为 NFA，然后将 NFA 转换为 DFA。但最后一步可以
导致 DFA 状态数量呈指数级增长，因此这只会是
对于非常简单的正则表达式是可行的。

如果您正在使用扩展的正则表达式语法，那么一切皆有可能：上下文无关语言
在交集下不闭合，因此此方法不起作用。

回复收藏 0 原文