用于将正则表达式转换为 NFA 的库？

发布于 2024-07-16 08:03:28 字数 500 浏览 11 评论 0原文

是否有一个好的库可以将正则表达式转换为NFA？我看到了很多关于这个主题的学术论文，它们很有帮助，但在工作代码方面却没有太多帮助。

我的问题部分是出于好奇，部分是由于在我正在开发的生产系统上加速正则表达式匹配的实际需要。尽管为了学习而探索这个主题可能很有趣，但我不确定这是否是加速模式匹配的“实用”解决方案。我们是一家 Java 商店，但很乐意接受任何语言的优秀代码的指导。

编辑：

有趣的是，我不知道Java的正则表达式已经是NFA了。本文的标题让我相信事实并非如此。顺便说一句，我们目前正在 Postgres 中进行正则表达式匹配；如果简单的解决方案是将匹配移至 Java 代码中那就太好了。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

鹿童谣 2024-07-23 08:03:28

满足您加速正则表达式的需求：

Java 的正则表达式引擎实现是基于 NFA 的。因此，为了调整你的正则表达式，我想说你会受益于对引擎如何实现的更深入的了解。

因此，我指导您：掌握正则表达式这本书对 NFA 引擎进行了大量处理，并且它如何执行匹配，包括如何调整特定于 NFA 引擎的正则表达式。

此外，请查看原子分组来调整您的正则表达式。

回复收藏 0 原文

勿忘心安 2024-07-23 08:03:28

免责声明：我不是 java+regexes 方面的专家。但是，如果我理解正确的话...

如果 Java 的正则表达式匹配器与大多数其他匹配器类似，那么它确实使用 NFA - 但不是您所期望的方式。它不是您可能听说过的仅前向实现，而是使用回溯解决方案，该解决方案简化了子表达式匹配，并且可能是后向引用使用所必需的。然而，它的交替性能很差。

您想看到： http://swtch.com/~rsc/regexp/regexp1.html （关于在这种改变的架构上表现不佳的边缘情况）。

我还写了一个问题，我认为可以归结为同一件事：

可以处理机器生成的正则表达式的正则表达式实现：*非回溯*，O(n)？

但基本上，由于一些非常奇怪的原因，所有常见的主要供应商正则表达式实现都非常糟糕在某些正则表达式上使用时的性能，即使这是不必要的。

回复收藏 0 原文

望笑 2024-07-23 08:03:28

免责声明：我是一名谷歌员工，而不是正则表达式专家。

有一堆比 JDK 更快的正则表达式库，其中之一是 dk.brics.automaton。根据文章中链接的基准，它是比 JDK 实现快大约 20 倍。

该库由 Anders Møller 编写，并且已mavenized。

回复收藏 0 原文

~没有更多了~

关于作者

音盲

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

用于将正则表达式转换为 NFA 的库？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

西西弗的石头怪

5397313

烟沫凡尘

一个破名字

萌︼了一个春

当爱已成负担

友情链接

用于将正则表达式转换为 NFA 的库？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

西西弗的石头怪

5397313

烟沫凡尘

一个破名字

萌︼了一个春

当爱已成负担

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。