实现 lex 时将多个正则表达式转换为 DFA

发布于 2024-12-19 23:32:15 字数 260 浏览 5 评论 0 原文

我正在学习编写一个词法分析器生成器（lex的克隆），基于正则表达式到“龙书”中描述的DFA直接翻译算法。

现在我可以成功地将正则表达式转换为 DFA，但是当存在多个规则时我会陷入困境，例如：

abc { printf("abc"); }
a* { printf("a*); }

我可以将 abc 和 a* 转换为两个 DFA 图，但如何将这两个 DFA 图合并为一张呢？

原文

I'm learning to write a lexical analyzer generator (a clone of lex), based on regular expression to DFA direct translation algorithm described in "Dragon Book".

Now I can successfully convert a regular expression to DFA, but I got stuck when there is multiple rules, for example:

abc { printf("abc"); }
a* { printf("a*); }

I can convert abc and a* to two DFA graphs, but how to combile these two DFA graphs to only one?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

栩栩如生 2024-12-26 23:32:15

事实上，我几年前就做过这个练习——我以这本书为指导，用 C++ 构建了一个集成的词法分析器和 LALR 解析器。这本书实际上告诉你如何将正则表达式直接转换为 NFA，然后使用我现在不太记得名称的算法将 NFA 转换为 DFA。要支持多个规则，您只需为每个规则创建一个 NFA。然后，您创建一个新的开始状态，并从您的开始状态到为每个规则创建的每个 NFA 的开始状态创建 epsilon 转换。至少，这是我在不检查代码的情况下能记住的。