什么是规律性？

发布于 2024-08-18 00:11:50 字数 250 浏览 4 评论 0原文

这更像是一个计算机科学问题，而不是一个编程问题，但我认为这是所有相关网站中提出这个问题的最佳地点。

当我发现正则表达式并查找该术语时，我认为“规则性”的这种属性是指表达式的语言具有可定义的结构模式这一事实。然而，在阅读有关该主题及其背后的理论时，我了解到有些语言是不规则的，但从它们的定义方式来看，很明显有一种模式可以与它们匹配。一种这样的语言是 (a^n)(b^n)。显然这是一种模式，但这不是常规语言。所以现在我想知道是什么让常规语言成为常规语言，而这种语言却不是？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

青衫负雪 2024-08-25 00:11:50

直观地解释计算机科学是......棘手的。我会尝试一下，但请记住，其中一些内容将“足够接近”，但理论上并不严格。

常规语言是一种可以由计算等效于有限自动机（DFA/NDFA）的机器决定的语言。有限自动机可以被认为是纯粹在状态下运行的机器，没有存储。所以你可以看到 aⁿbⁿ 不能是正则的，因为它需要一台可以计算 a 和 b 数量的机器（因此必须具有无限*存储容量）以便对它们进行比较。

作为比较，(abc)ⁿ 是正则的，因为重复次数无关。

要获得更严格（以及相应更密集的视图），请查看维基百科文章和链接页面。

_{*无限在这里并不重要，但我为了完整性而提到它。将其视为“幸运的是，总是足够的”存储可能更容易。}

回复收藏 0 原文

雨巷深深 2024-08-25 00:11:50

该名称的词源来自 Kleene 1950 年代的作品，该作品使用他为此目的创建的数学符号来描述正则集。请参阅此。

回复收藏 0 原文

橙味迷妹 2024-08-25 00:11:50

也许维基百科关于常规语言的文章可以比我们更好地解释它。不过，我会尝试一下。

从理论的角度来看，常规语言（字符串集）是可以使用有限状态自动机生成的语言。用程序员的话来说，这相当于说它可以使用正则表达式生成。因此，所有有限语言（字符串集合）都是正则语言，但也有一些无限语言，例如 aⁿbⁿ （n a 的所有字符串的语言）后跟 n b's) 无法使用 FSA 或正则表达式进行识别。有更强大的计算设备（例如现代计算机，使用图灵机建模）可以识别这些语言。

正则表达式在字符串搜索编程中如此广泛使用的原因是，它们可以识别对我们程序员来说很重要的绝大多数字符串，同时可以实现非常快速搜索有限状态自动机。