从抽象语法树获取控制流程图

发布于 2024-07-05 17:58:45 字数 261 浏览 9 评论 0原文

我有一个源自 Java ANTLR Parser Generator 的 AST。我想要做的是以某种方式构建源代码的控制流图，其中每个语句或表达式都是一个唯一的节点。我知道这个识别一定有一些递归性，我想知道你会建议什么作为最好的选择，以及 ANTLR 是否有一个我可以用来完成这项工作的工具集。干杯， Chris

编辑 - 我主要关心的是从 AST 获取控制流图（CFG）。这样我就可以获得源的树表示。澄清一下，源代码和实现语言都是Java。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

离去的眼神 2024-07-12 17:58:45

通常，CFG 是在较低级别的表示（例如 JVM 字节码）上计算的。有人就这样的事情做了一篇论文几年前。其中可能描述了一种有用的方法来获取该表示。

由于您的源语言和目标语言相同，因此没有代码生成步骤 - 您已经完成了！然而，现在你可以走 AST 了。在 AST 的每个节点，你都要问自己：这是否是一条“跳转”指令？方法调用和 if 语句是跳转指令的示例。循环结构（例如 for 和 while）也是如此。加法和乘法等指令是非跳转的。

首先将 CFG 中的每个 java 语句与一个节点相关联，以及一个入口和出口节点。作为第一个近似，遍历树并：

如果当前语句是方法调用，则找出该方法调用的相应主体的入口节点在哪里，并创建一条从当前语句指向该入口节点的边。如果该语句是方法返回，则枚举可能调用它的位置并为其添加边缘。
对于每个非跳跃语句，在它和下一个语句之间建立一条边。

这将为您提供某种的CFG。该过程在步骤 2 中有点麻烦，因为调用的方法可能在库中声明，而不是在 AST 中的其他地方声明 - 如果是这样，要么不创建边，要么为表示该条目的特殊节点创建边库方法。

这有道理吗？

回复收藏 0 原文

梦忆晨望 2024-07-12 17:58:45

您是否尝试过ANTLR Studio？它不会生成空洞 AST 图，但对于回顾来说，它已经非常有帮助了。

回复收藏 0 原文

﹂绝世的画 2024-07-12 17:58:45

当我过去这样做时，我使用 graphviz，特别是点工具，来生成图表。我通过在编译时实际遍历控制流图来创建点输入文件。

图形布局是一个难题，而 graphviz 做得非常出色。它可以输出为 ps、pdf 和各种图像格式，并且布局通常看起来非常直观。我强烈推荐它。

回复收藏 0 原文

氛圍 2024-07-12 17:58:45

我认为我无法以您可能正在寻找的方式回答您的问题，因为我不知道 ANTLR 中有什么方法可以生成带有或不带有 AST 的 CFG。但是，简而言之，您将使用 ANTLR 生成的内容来生成一个单独的 Java 程序来生成 CFG。您可以利用 ANTLR 生成的语法树作为输入，在您自己创建的单独 Java 程序中生成 CFG。此时，您实质上正在构建一个编译器。 “编译器”和 JVM 之间的区别在于，您的输出是程序如何分支其各种执行路径的可视化表示 (CFG)，而 JVM/Java 编译器生成在真实机器 (CPU) 上执行的代码。

打个比方，如果有人坐下来写一本书（例如英语），句子中使用的各个单词就是计算机语言的令牌，句子的形成方式与上下文无关语法表达有效计算机代码的方式类似，而段落& 整部小说以类似的方式讲述一个故事，语义分析/编译器/CFG 可能会产生/表示逻辑上有效的程序，这些程序实际上做了一些有用的事情，并且或多或少没有逻辑错误。换句话说，一旦克服了有效语法（正确的句子结构）的问题，任何人都可以在一页上写一堆句子，但只有某些句子组合才能产生实际做某事（讲故事）的文本。

您要问的是最后一部分 - 如何获取语法树并转换或解释 AST 实际在逻辑上所做的事情。当然，您需要为您想要执行此操作的每种语言构建一个“编译器”。拥有正确的语法并不能告诉您程序的作用 - 只是从语法的角度来看程序是正确的。

Linters、语法荧光笔和 IDE 都是围绕着这样的想法构建的：试图让最后一块拼图对人类来说变得更容易、更高效。

回复收藏 0 原文

甚是思念 2024-07-12 17:58:45

根据一些评论，听起来OP确实想做代码生成 -- 将 AST 转换为基于基本块和跳转点的较低级指令序列。

代码生成是非常特定于语言的，并且已经在这个主题上投入了大量的工作。在进行代码生成之前，您需要了解您的目标语言 - 无论是汇编语言还是其他高级语言。一旦确定了这一点，您只需遍历 AST 并生成一系列指令来实现 AST 中的代码。（我说这很简单，但它可能很难 - 很难概括，因为这里的考虑因素非常特定于语言。）

您为代码生成选择的表示将隐式或显式地包含控制流图。如果您的目标语言相当低级（接近汇编语言），那么控制流图应该相对容易提取。

（如果您需要更多说明，请发表评论。）

回复收藏 0 原文