当前位置：文江博客话题详情

用 C 语言构建词法分析器

发布于 2024-07-24 15:44:12 字数 199 浏览 14 评论 0原文

我想用 C 语言构建一个词法分析器，并且我正在关注 dragon book，我可以理解状态过渡，但如何实施？

有更好的书吗？

事实上，我必须通过多个状态来解析字符串，以便我可以判断该字符串是否可接受！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

远昼 2024-07-31 15:44:13

如果您正在寻找比龙书更现代的治疗方法：Andrew W. Appel 和 Maia Ginsburg，《现代》C 语言编译器实现，剑桥大学出版社，2008 年。

第 2 章重点介绍词法分析：词法标记、正则表达式、有限自动机；非确定性有限自动机；词法分析器生成器

查看目录

回复收藏 0 原文

執念 2024-07-31 15:44:13

程序 flex（lex 的克隆）将为您创建一个词法分析器。

给定一个带有词法分析器规则的输入文件，它将生成一个 C 文件，其中包含这些规则的词法分析器的实现。

因此，您可以检查 flex 的输出，了解如何用 C 编写词法分析器。也就是说，如果您不仅仅想使用 flex 的词法分析器...

回复收藏 0 原文

送君千里 2024-07-31 15:44:12

您可以使用单个状态变量实现简单的状态转换，例如，如果您想循环状态 start->part1->part2->end 那么您可以使用枚举来跟踪当前状态并使用您想要在每个状态下运行的代码的 switch 语句。

enum state { start=1, part1, part2, end} mystate;

// ...
mystate = start;
do {
  switch (mystate) {
    case start:
      // ...
    case part1:
      // ...
    case part2:
      // ...
      if (part2_end_condition) mystate = end; // state++ will also work
      // Note you could also set the state back to part1 on some condition here
      // which creates a loop
      break;
  }
} while (mystate != end);

对于依赖于多个变量的更复杂的状态转换，您应该使用如下表/数组：

var1    var2    var_end    next_state
0       0       0          state1
0       1       0          state2
1       0       0          state3
1       1       0          state4
-1      -1      1          state_end // -1 represents "doesn't matter" here

You can implement simple state transitions with a single state variable, for example if you want to cycle through the states start->part1->part2->end then you can use an enum to keep track of the current state and use a switch statement for the code you want to run in each state.

enum state { start=1, part1, part2, end} mystate;

// ...
mystate = start;
do {
  switch (mystate) {
    case start:
      // ...
    case part1:
      // ...
    case part2:
      // ...
      if (part2_end_condition) mystate = end; // state++ will also work
      // Note you could also set the state back to part1 on some condition here
      // which creates a loop
      break;
  }
} while (mystate != end);

For more complex state transitions that depend on several variables, you should use tables/arrays like this:

var1    var2    var_end    next_state
0       0       0          state1
0       1       0          state2
1       0       0          state3
1       1       0          state4
-1      -1      1          state_end // -1 represents "doesn't matter" here

回复收藏 0 原文

メ斷腸人バ 2024-07-31 15:44:12

天啊，

假设您指的是有关编译器设计的《The Dragon》一书，我建议您浏览一下此页面关于编译工具。

该页面本身很小，但提供了有关词法分析器的各种优秀资源的链接。

HTH

欢呼，

回复收藏 0 原文

把人绕傻吧 2024-07-31 15:44:12

有不止一种方法可以做到这一点。每个正则表达式都直接对应于一个简单的结构化程序。例如，数字的表达式可能是这样的：

// regular expression
digit* [.digit*]

相应的 C 代码将是：

// corresponding code
while(DIGIT(*pc)) pc++;
if (*pc=='.'){
    pc++;
    while(DIGIT(*pc)) pc++;
}

在我看来，构建词法分析器的转换表方式不必要地复杂，并且显然运行速度较慢。

There's more than one way to do it. Every regular expression corresponds directly to a simple structured program. For example, an expression for numbers could be this:

// regular expression
digit* [.digit*]

and the corresponding C code would be:

// corresponding code
while(DIGIT(*pc)) pc++;
if (*pc=='.'){
    pc++;
    while(DIGIT(*pc)) pc++;
}

The transition-table way of building lexers is, in my opinion, needlessly complicated, and obviously runs slower.

回复收藏 0 原文

~没有更多了~

关于作者

笑叹一世浮沉

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

用 C 语言构建词法分析器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

用 C 语言构建词法分析器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

alipaysp_snBf0MSZIv

梦断已成空

瞎闹

凯凯我们等你回来

寄意

似梦非梦

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。