包含有序交替的正则表达式可以重写为仅使用无序交替吗？

发布于 2024-11-25 13:10:49 字数 633 浏览 3 评论 0原文

假设我有一种正则表达式语言，支持文字、正负字符类、有序交替、贪婪量词 ?、* 和 +，并且非贪婪量词 ??、*? 和 +?。（这本质上是 PCRE 的一个子集，没有反向引用、环视断言或其他一些更奇特的位。）用无序交替替换有序交替是否会降低这种形式主义的表达能力？

（无序交替——有时也称为“无序选择”——满足 L(S|T) = L(S) + L(T)，而有序交替满足 L(S|T) = L (S) + (L(T) - { a in L(T) : a extends some b in L(S) }) 具体来说，模式 a|aa 将匹配字符串 。 >a 和如果交替是无序的，则aa，但如果交替是有序的，则只有a。）

换句话说，给定一个包含有序交替的模式S，该模式可以重写为一个不包含有序交替的等效模式 T（但可能是无序交替）？

如果这个问题已在文献中考虑过，我将不胜感激任何人都可以提供的参考资料。我几乎没有发现任何关于扩展正则表达式形式主义的表达能力的理论著作（除了关于反向引用如何将你从常规语言转移到上下文无关语法的常见问题之外）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

腹黑女流氓 2024-12-02 13:10:49

在 http://swtch.com/~rsc/regexp/regexp3.html [ “正则表达式是否匹配字符串的子字符串？如果是，在哪里？”]有必要在“DFA”中引入优先级的概念（我怀疑，您需要阅读整个系列才能理解，但是“DFA” ”所讨论的问题是从 NFA 图“动态”扩展而来）以处理有序交替。虽然这只是对权威的呼吁，而不是证明，但我认为可以公平地说，如果 russ cox 不能做到这一点（将有序交替表示为纯粹的 DFA），那么没有人知道如何做到。

回复收藏 0 原文

绾颜 2024-12-02 13:10:49

我没有检查任何文献，但我认为你可以为有序交替构建一个 DFA，从而证明它不会通过以下方式添加任何表达能力：

假设我们有正则表达式 x||y< /strong> 其中 x 和 y 是正则表达式，|| 表示无序交替。如果是这样，我们可以构建接受 x 和 y 的 DFA。我们将标记 DFA_x 和 DFA_y
我们将通过连接 DFA_x 分阶段构建 x||y 的 DFA和 DFA_y
对于 DFA_x 中对应于某个字符串 a 的每个路径（路径是指图形意义上的路径，无需遍历和边缘两次，因此a 是 DFA_"a*" 中的路径，但 aa 不是）...
- 对于字母表 s 中的每个符号
  - 如果 DFA_y 消耗 as（即如果在 as 上运行）DFA_y 不会提前停止，但可能会不一定接受），并且 DFA_x 不接受，并且 DFA_x 不接受 as 的任何前缀，创建从状态 DFA_x< 的转换/strong> 消耗后结束a 到消耗as后DFA_y结束的状态
最终 DFA 的接受状态是两个输入 DFA 的所有接受状态。起始状态是DFA_x的起始状态。