当前位置：文江博客话题详情

平均正则表达式算法的时间复杂度是多少？

发布于 2024-11-05 10:42:05 字数 169 浏览 1 评论 0原文

我对使用正则表达式并不陌生，并且我了解它们所基于的基本理论——有限状态机。

不过，我不太擅长算法分析，也不明白正则表达式与基本线性搜索相比如何。我这么问是因为从表面上看这似乎是一个线性数组搜索。（如果正则表达式很简单。）

我可以在哪里了解有关实现正则表达式引擎的更多信息？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

浅忆 2024-11-12 10:42:05

这是最流行的大纲之一：正则表达式匹配可以简单而快速
。针对字符串运行 DFA 编译的正则表达式确实是 O(n)，但最多可能需要 O(2^m) 构建时间/空间（其中 m = 正则表达式大小）。

回复收藏 0 原文

思念绕指尖 2024-11-12 10:42:05

您熟悉术语确定性/非确定性有限自动机吗？

真实正则表达式（当我说真实时，我指的是那些识别正则语言的正则表达式，而不是几乎所有编程语言都支持的正则表达式包含反向引用等）可以转换为 DFA/NFA，并且两者都可以用编程语言以机械方式实现（NFA 可以转换为 DFA）

你要做的是：

找到一种方法来转换正则表达式变成自动机
用您喜欢的编程语言实现自动机的识别

这样，给定一个正则表达式，您可以将其转换为 DFA 并运行它以查看它是否匹配指定的文本。

这可以在 O(n) 中实现，因为 DFA 不会向后移动（就像图灵机），因此它与字符串匹配或不匹配。那是假设你不会接受计数重叠的匹配，否则你将不得不返回并重新开始匹配......

回复收藏 0 原文

冷弦 2024-11-12 10:42:05

经典的正则表达式可以通过一种在实践中速度很快但具有非常糟糕的最坏情况行为（标准 DFA）的方式来实现，或者以一种保证合理的最坏情况行为的方式（将其保留为 NFA）来实现。标准 DFA 可以扩展以支持大量额外的匹配字符和标志，这利用了它基本上是回溯搜索的事实。

标准方法的例子随处可见（例如内置于 Perl 中）。 http://code.google.com/p/re2 上有一个声称具有良好的最坏情况行为的示例/ - 事实上，在最坏的情况下，它甚至比我预期的还要好，所以他们可能发现了一两个额外的技巧。

如果您对此感兴趣，或者关心编写可以锁定给定病理输入的程序，请阅读 http://swtch.com/~rsc/regexp/regexp1.html。

回复收藏 0 原文

~没有更多了~

关于作者

叫嚣ゝ

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

平均正则表达式算法的时间复杂度是多少？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

平均正则表达式算法的时间复杂度是多少？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

烙印

singlesman

给自己一个微笑

独孤求败

晨钟暮鼓

我是自愿种绣球花的

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。