有没有办法按特殊性对正则表达式列表进行排序？

发布于 2024-12-09 10:21:02 字数 267 浏览 8 评论 0原文

我正在寻找允许我对正则表达式列表进行排序的东西，或一些文档和研究，

根据其特异性/严格性

/[a-z]+/           // most strict
/[a-z0-9]+/
/[a-z0-9èòà]+/     // less strict
/.*/

呢

/[a-z]+ABC/
/[a-z0-9]+/

，但哪一个比另一个不太具体

？先感谢您

原文

I'm looking for something that allows me to sort a list of regular expression,
or some documentation and research,

according to their specificity/strictness

/[a-z]+/           // most strict
/[a-z0-9]+/
/[a-z0-9èòà]+/     // less strict
/.*/

but how about

/[a-z]+ABC/
/[a-z0-9]+/

which one is less specific than the other?

thank you in advance

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

分开我的手 2024-12-16 10:21:02

人们可以将正则表达式等同于它匹配的一组字符串（称为“正则语言”）。如果我们的正则表达式名为 E，我们就将其匹配字符串称为 L(E)< /代码>。

您上面提到的严格性就变成了子集关系：如果 L(A)，则定义 RE A 比 RE B 更严格是L(B)的真子集。这消除了诸如“相同”RE 的同义词之类的歧义：它们之所以相同，正是因为它们具有相同的常规语言。

正如 @yi_H 指出的，RE 语言（在某些常见字母表上）的子集关系形成了部分排序。听起来你想要一个完整的订单。如果是这样，您可以规定可接受的全排序应嵌入由子集关系表示的部分排序。

对于如何构建总排序，我没有明确的答案，但我想到了两种方法。

第一个是利用抽引理。事实证明，对于任何 RE，如果它匹配足够长的字符串，那么它还必须匹配可通过重复某些小节从第一个字符串构造的更长字符串。您可以询问没有任何此类重复段的最长匹配字符串的长度是多少，并将其作为您的指标。也许这尊重（嵌入）部分排序，也许不尊重。

另一个是考虑 RE 状态机上的图转换。我怀疑（但我没有任何参考资料）如果 RE A 比 RE B 更严格，那么 B 的自动机将可以通过折叠状态或一些类似的简化操作从A进行计算。您可以将度量定义为 RE 最小自动机中的状态数。

回复收藏 0 原文

治碍 2024-12-16 10:21:02

正如您的第二个示例所示，您不能对正则表达式进行总排序，只能使用部分顺序。

更糟糕的是，您可以通过多种方式编写相同的正则表达式：[ab]b 与 (ab|bb)、aa*< /code> 与 a+。因此，即使确定两个正则表达式是否等效也不是一项简单的任务。

回复收藏 0 原文

夏雨凉 2024-12-16 10:21:02

假设您正在谈论纯正则表达式，而不是疯狂的 Perl 东西，您可以根据它们接受的字符串集（即，查看正则表达式作为正则语言）。

鉴于常规语言的差异、交集和空性都是可判定的问题，这意味着有一些算法可以告诉您一个表达式是否接受另一个表达式接受的所有字符串。

回复收藏 0 原文

~没有更多了~

关于作者

×眷恋的温暖

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

有没有办法按特殊性对正则表达式列表进行排序？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

有没有办法按特殊性对正则表达式列表进行排序？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。