JavaScript词法分析过程的具体描述问题?
在学习JavaScript词法分析的过程,有一点疑惑,动态解析JS的过程分为两个阶段,语法检查和运行阶段。语法检查包括词法分析和语法分析,在词法分析过程中,看到网上较多是这样描述的,比如这一篇:
原文描述:
在词法分析阶段,JavaScript解释器先把javascript代码(字符串)的字符流按照ECMAScript标准转换为记号流。
例如:把字符流:a = (b - c)
;
转换为记号流:
NAME "a"
EQUALS
OPEN_PARENTHESIS
NAME "b"
MINUS
NAME "c"
CLOSE_PARENTHESIS
SEMICOLON
然后在语法分析阶段:JavaScript语法分析器在经过词法分析后将记号流,按照ECMAScript标准把词法分析所产生的记号生成语法树。
上面的描述过程和在书上《你不知道的JS 上》有差别,在书中,将词法分析过程描述为:
分词/词法分析:这个过程会将由字符组成的字符串分解成(对编程语言来说)有意义的代码块,这些代码块被称为词法单元(token).
解析/语法分析:这个过程将词法单元流(数组)转换成一个有元素逐级嵌套所组成的代表了程序语法结构的树,这个树被称为"抽象语法树"(AST).
上文中的词法分析后的记号流和书中的词法单元token有区别吗?
还有在这篇文章:如何用JavaScript编写简单的解释器中,和书中的描述一致,原文大致如下:
在词法阶段,词法分析器将由字符组成的字符串作为输入,然后将字符串分解成词法单元(token),比如对
( 12 + 4 ) / 6
这段代码,词法分析器将其分割为各个独立的部分,即token,输出列表形如:
{
["operator", "("],
["number", 12],
["operator", "+"],
["number", 4],
["operator", ")"],
["operator", "/"],
["number", 6]
}
分析器把词法分析器产生的token列表作为输入,根据某种语法规则进行分析,并输出表现语法结构的分析树:
{
operation: "/",
left: {
operation: "+",
left: 12,
right: 4
}
right: 6
}
那么抽象语法树和这里的输出的语法结构分析树又有什么区别呢?
请问,在词法分析阶段是先产生记号流(记号流是什么?),由语法分析器产生语法树,还是将字符串分解为token,再产生AST??
网上版本较多,也没有学过编译原理,对上面的过程比较模糊,希望能得到比较详细的解答,谢谢。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
前端时间也在折腾这个,建议从现成的东西开始折腾起,js下有个jison,就是专门做语法分析的,我前段时间折腾一个项目的时候整过一批循序渐进的例子,可以去看看
https://github.com/zhs007/jison-demo
btw,如果是简单的四则运算其实不难的,但要到一个成熟的语言层面还是有些麻烦的,我在做一个建模语言,只考虑数据结构模型的建立,不考虑函数等,所以简单很多。
后面做另外一个项目时,也有考虑做一个简单的语言,特殊用途的,还没开始动手,有需要的话,也可以和我交流。