当前位置：文江博客话题详情

parsing tokenize lexer

寻找“分词器”、“解析器”的明确定义。和“词法分析器” 它们是如何相互关联和使用的？

发布于 2024-07-10 04:47:32 字数 296 浏览 13 评论 0原文

我正在寻找“分词器”、“解析器”和“词法分析器”的明确定义以及它们如何相互关联（例如，解析器是否使用分词器，反之亦然）？我需要创建一个程序将通过 c/h 源文件来提取数据声明和定义。

我一直在寻找示例并且可以找到一些信息，但我真的很难掌握语法规则、解析树和抽象语法树等基本概念以及它们如何相互关联。最终这些概念需要存储在实际的程序中，但是 1）它们是什么样的，2）是否有常见的实现。

我一直在查看有关这些主题和程序（例如 Lex 和 Yacc）的维基百科，但从未上过编译器课程（EE 主修），我发现很难完全理解正在发生的事情。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

桃扇骨 2024-07-17 04:47:33

分词器通常通过查找空白（制表符、空格、换行符）将文本流分解为标记。

词法分析器基本上是一个标记生成器，但它通常为标记附加额外的上下文——这个标记是一个数字，那个标记是一个字符串文字，另一个标记是一个相等运算符。

解析器从词法分析器获取标记流，并将其转换为代表由原始文本表示的（通常）程序的抽象语法树。

最后我查了一下，关于这个主题的最好的书是“编译器：原理、技术和工具”通常被称为“龙之书”。

回复收藏 0 原文

ぺ禁宫浮华殁 2024-07-17 04:47:33

示例：

int x = 1;

词法分析器或分词器会将其拆分为标记“int”、“x”、“=”、“1”、“;”。

解析器将获取这些标记并使用它们以某种方式进行理解：

我们有一个声明，
它是一个整数的定义，
该整数称为“x”，
“x”应该初始化为值 1

Example:

int x = 1;

A lexer or tokeniser will split that up into tokens 'int', 'x', '=', '1', ';'.

A parser will take those tokens and use them to understand in some way:

we have a statement
it's a definition of an integer
the integer is called 'x'
'x' should be initialised with the value 1

回复收藏 0 原文

云之铃。 2024-07-17 04:47:33

我想说词法分析器和分词器基本上是同一件事，它们将文本分解为其组成部分（“标记”）。然后解析器使用语法解释标记。

不过，我不会太在意精确的术语用法——人们经常使用“解析”来描述解释一大堆文本的任何动作。

回复收藏 0 原文

你是暖光i 2024-07-17 04:47:33

（添加到给定的答案）

Tokenizer还将删除任何注释，并且仅将标记返回到词法分析器。
Lexer 还将定义这些标记（变量/函数）的范围，
然后解析器将构建代码/程序结构

回复收藏 0 原文

~没有更多了~

关于作者

水染的天色ゝ

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

琉璃梦幻

文章 0 评论 0

qq_4zWU6L

文章 0 评论 0

话少情深

文章 0 评论 0

西西弗的石头怪

文章 0 评论 0

彻夜缠绵

文章 0 评论 0

千寻…

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文