作者:jystmj-2009 | 来源:互联网 | 2024-11-01 16:33
在学习Javascript词法分析的过程,有一点疑惑,动态解析JS的过程分为两个阶段,语法检查和运行阶段。语法检查包括词法分析和语法分析,在词法分析过程中,看到网上较多是这样描述的,比如这一篇:原文描
在学习Javascript词法分析的过程,有一点疑惑,动态解析JS的过程分为两个阶段,语法检查和运行阶段。语法检查包括词法分析和语法分析,在词法分析过程中,看到网上较多是这样描述的,比如这一篇:
原文描述:
在词法分析阶段,Javascript解释器先把Javascript代码(字符串)的字符流按照ECMAScript标准转换为记号流。
例如:把字符流:
;
转换为记号流:
1 2 3 4 5 6 7 8
| NAME "a"
EQUALS
OPEN_PARENTHESIS
NAME "b"
MINUS
NAME "c"
CLOSE_PARENTHESIS
SEMICOLON |
然后在语法分析阶段:Javascript语法分析器在经过词法分析后将记号流,按照ECMAScript标准把词法分析所产生的记号生成语法树。
上面的描述过程和在书上《你不知道的JS 上》有差别,在书中,将词法分析过程描述为:
分词/词法分析:这个过程会将由字符组成的字符串分解成(对编程语言来说)有意义的代码块,这些代码块被称为词法单元(token).
解析/语法分析:这个过程将词法单元流(数组)转换成一个有元素逐级嵌套所组成的代表了程序语法结构的树,这个树被称为"抽象语法树"(AST).
上文中的词法分析后的记号流和书中的词法单元token有区别吗?
还有在这篇文章:如何用Javascript编写简单的解释器中,和书中的描述一致,原文大致如下:
在词法阶段,词法分析器将由字符组成的字符串作为输入,然后将字符串分解成词法单元(token),比如对
这段代码,词法分析器将其分割为各个独立的部分,即token,输出列表形如:
1 2 3 4 5 6 7 8 9
| {
["operator", "("],
["number", 12],
["operator", "+"],
["number", 4],
["operator", ")"],
["operator", "/"],
["number", 6]
} |
分析器把词法分析器产生的token列表作为输入,根据某种语法规则进行分析,并输出表现语法结构的分析树:
1 2 3 4 5 6 7 8 9
| {
operation: "/",
left: {
operation: "+",
left: 12,
right: 4
}
right: 6
} |
那么抽象语法树和这里的输出的语法结构分析树又有什么区别呢?
请问,在词法分析阶段是先产生记号流(记号流是什么?),由语法分析器产生语法树,还是将字符串分解为token,再产生AST??
网上版本较多,也没有学过编译原理,对上面的过程比较模糊,希望能得到比较详细的解答,谢谢。