当前位置：文江博客话题详情

parsing c lexical-analysis

如何解析上下文相关的 C 代码？

发布于 2024-11-07 01:22:50 字数 240 浏览 2 评论 0原文

我遇到的一个问题是 C 必须是上下文相关的，并且不能用一个先行标记来解析。例如

int main1;
int main() {}

，这是我能想到的最简单的示例，其中函数定义和变量声明都以相同的标记类型开头。您必须一直查看左括号或分号才能确定要解析的内容。

我的问题是，这是如何实现的？词法分析器是否有一些技巧来进行前瞻并发出一个看不见的标记来区分两者？现代解析有很多向前看的标记吗？

One issue I ran into was that C must be context-sensitive and cannot be parsed with one token of lookahead. For example

int main1;
int main() {}

That's the simplest example I can think of in which both a function definition and a variable declaration start with the same token type. You'd have to look all the way ahead to the left paren or semicolon to determine what to parse.

My question is, how is this accomplished? Does the lexical analyzer have some tricks up its sleeve to do the lookahead and emit an invisible token distinguishing the two? Do modern parses have many tokens of lookahead?

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

不可一世的女人 2024-11-14 01:22:50

您应该阅读 LR 或移位归约解析器。他们自下而上地组装解析树。对于 main 函数来说，它是这样的：

将 int 作为 TYPE 终端标记移入堆栈
将 main 作为 IDENTIFIER 移入堆栈终端令牌
将 ( 移入堆栈
shift ) 移入堆栈
删除 ( 和 ) 并替换为 ARGLIST非终端标记
将 { 移入堆栈将
} 移入堆栈
删除这些标记并用 STMT_BLOCK 替换非终止标记
删除 TYPE、IDENTIFIER、ARGLIST 和 STMT_BLOCK 标记，并替换为 FUNCTION_DEF 令牌。

当然，每次进行替换时，它都会构建一个新的解析树片段并将其附加到新标记上。
（我编了这些令牌名称。）

它在有限状态机的控制下工作，该状态机识别堆栈上令牌的模式，并与输入的下一个（单个）令牌一起决定是否移入下一个令牌，或者应用其中一个语法规则将堆栈上的一组标记减少为单个标记。 FSM 由解析器生成器根据语法规则列表构建。

之所以称为 LR，是因为它从左侧读取输入标记，但从右侧应用语法规则。它与 LL（即递归下降）不同，后者从左侧应用语法规则。 Pascal 是一种 LL(1) 语言。 C 不是 LL(1)，因此需要 LR(1) 解析器。
例如，它允许 C 将几乎所有内容嵌入嵌套括号中，而不会混淆解析器。

我希望这可以帮助您了解发生了什么。

回复收藏 0 原文

~没有更多了~

关于作者

深海夜未眠

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

離殇

文章 0 评论 0

小姐丶请自重

文章 0 评论 0

Aik

文章 0 评论 0

国产ˉ祖宗

文章 0 评论 0

猥琐帝

文章 0 评论 0

半仙

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文