热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

深入解析JavaScript词法分析的具体流程与常见问题

在学习Javascript词法分析的过程,有一点疑惑,动态解析JS的过程分为两个阶段,语法检查和运行阶段。语法检查包括词法分析和语法分析,在词法分析过程中,看到网上较多是这样描述的,比如这一篇:原文描

在学习Javascript词法分析的过程,有一点疑惑,动态解析JS的过程分为两个阶段,语法检查和运行阶段。语法检查包括词法分析和语法分析,在词法分析过程中,看到网上较多是这样描述的,比如这一篇:
原文描述:
在词法分析阶段,Javascript解释器先把Javascript代码(字符串)的字符流按照ECMAScript标准转换为记号流。
例如:把字符流:

1
a = (b - c)

;
转换为记号流:

1
2
3
4
5
6
7
8
NAME "a"

EQUALS

OPEN_PARENTHESIS

NAME "b"

MINUS

NAME "c"

CLOSE_PARENTHESIS

SEMICOLON

然后在语法分析阶段:Javascript语法分析器在经过词法分析后将记号流,按照ECMAScript标准把词法分析所产生的记号生成语法树。

上面的描述过程和在书上《你不知道的JS 上》有差别,在书中,将词法分析过程描述为:
分词/词法分析:这个过程会将由字符组成的字符串分解成(对编程语言来说)有意义的代码块,这些代码块被称为词法单元(token).
解析/语法分析:这个过程将词法单元流(数组)转换成一个有元素逐级嵌套所组成的代表了程序语法结构的树,这个树被称为"抽象语法树"(AST).

上文中的词法分析后的记号流和书中的词法单元token有区别吗?

还有在这篇文章:如何用Javascript编写简单的解释器中,和书中的描述一致,原文大致如下:

在词法阶段,词法分析器将由字符组成的字符串作为输入,然后将字符串分解成词法单元(token),比如对

1
( 12 + 4 ) / 6

这段代码,词法分析器将其分割为各个独立的部分,即token,输出列表形如:

1
2
3
4
5
6
7
8
9
{

     ["operator", "("],

       ["number", 12],

       ["operator", "+"],

       ["number", 4],

       ["operator", ")"],

       ["operator", "/"],

       ["number", 6]

  }

分析器把词法分析器产生的token列表作为输入,根据某种语法规则进行分析,并输出表现语法结构的分析树:

1
2
3
4
5
6
7
8
9
   {

       operation: "/",

       left: {

         operation: "+",

         left: 12,

         right: 4

       }

       right: 6

   }

那么抽象语法树和这里的输出的语法结构分析树又有什么区别呢?
请问,在词法分析阶段是先产生记号流(记号流是什么?),由语法分析器产生语法树,还是将字符串分解为token,再产生AST??
网上版本较多,也没有学过编译原理,对上面的过程比较模糊,希望能得到比较详细的解答,谢谢。


推荐阅读
author-avatar
jystmj-2009
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有