如何在编译器中实现前向引用？

发布于 2024-07-22 05:27:30 字数 463 浏览 11 评论 0原文

我正在使用 Lex 和 YACC（实际上是 Flex 和 Bison）创建一个编译器。该语言允许对任何符号进行无限制的前向引用（如 C#）。问题在于，如果不知道标识符是什么，就不可能解析该语言。

我知道的唯一解决方案是对整个源进行 lex 分析，然后进行“广度优先”解析，因此类声明和函数声明等更高级别的内容在使用它们的函数之前得到解析。然而，这对于大文件来说会占用大量内存，并且很难用 YACC 处理（我必须为每种类型的声明/主体创建单独的语法）。我还必须手写词法分析器（这不是什么大问题）。

我不太关心效率（尽管它仍然很重要），因为一旦完成，我将重写编译器本身，但我希望该版本能够很快（所以如果有任何快速的通用Lex/YACC 中无法完成但可以手动完成的技术，也请提出建议）。所以现在，开发的便利性是最重要的因素。

对于这个问题有什么好的解决办法吗？在 C# 或 Java 等语言的编译器中，这通常是如何完成的？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

过潦 2024-07-29 05:27:31

完全可以解析它。尽管标识符和关键字之间存在歧义，但 lex 会很乐意通过给予关键字优先级来解决这个问题。

我看不出还有什么其他问题。您不需要在解析阶段确定标识符是否有效。在解析时，您正在构建解析树或抽象语法树（区别很微妙，但与本讨论的目的无关）。之后，您可以通过对解析期间生成的 AST 执行传递来构建嵌套符号表结构。然后，您再次传递 AST 以检查所使用的标识符是否有效。接下来对 AST 进行一个或多个附加解析以生成输出代码或其他一些中间数据结构，然后就完成了！

编辑：如果您想了解它是如何完成的，请检查 Mono C# 编译器的源代码。这实际上是用 C# 而不是 C 或 C++ 编写的，但它确实使用了 Jay 的 .NET 端口，这与 yacc 非常相似。

回复收藏 0 原文