热门标签 | HotTags
当前位置:  开发笔记 > 程序员 > 正文

编译原理第四章习题存档

语法分析主要是将句子和语法树对应起来,明确其成分构成。接下来我们给一个句子添加一个末尾符号#,它为减少讨论作出卓越贡献。分析的时候将它也作为句子的一个符号分析。1.自顶向下自顶向下

语法分析主要是将句子和语法树对应起来,明确其成分构成。接下来我们给一个句子添加一个末尾符号#,它为减少讨论作出卓越贡献。分析的时候将它也作为句子的一个符号分析。


1. 自顶向下

自顶向下的过程是在试图为一个句子找到它的语法树,也就是拿一个个推导语句试探,看是否能凑出这个句子。但直接递归回溯显然太过暴力,我们试图对文法进行一定限制,在此基础上寻找规律,以缩小查找范围,实现读一个或一些字符,就能知道该用哪条语句。


-2. 消除左递归

1. 文法的矩阵表达

文法:

 矩阵表达,相乘后加变为或,非终结符号单独写在一个矩阵里,即为原文法:

2. 进行一些神秘排列

 3. 对着写出来


-1. 消除回溯

回溯是因为一个非终结符有多个候选式存在相同前缀,对它进行一些变换:

提取公共前缀,将剩余内容打包放进一个新的表达式。


1.  递归下降分析法

1. 简述

对每一非终结符号,编写一个子程序。如果读到的字符是某非终结符号的第一个终结符,那么调用其子程序。为了描述前面最长的那句话,引入FIRST集和FOLLOW集。

FIRST集为一个非终结符推导出来的第一个终结符;FOLLOW集为一个非终结符后第一个被推导出来的终结符。

例:

如果A->B,那么B的FIRST集也是A的FIRST集的子集;FOLLOW集同理。对于A->CD,c的FOLLOW集会是D的FIRST集。

2. 流程

每次读一个字符->确定接下来调用哪个非终结符的子程序->根据其FOLLOW集判断接下来调用哪个子程序


2. LL(1)分析法

1. LL(1)文法

从左到右,使用最左规约,每次读一个字符即可确定如何推导。

LL(1)文法的判断:

对于类似于A->α|β,FIRST(α)∩FIRST(β)=Φ;若α可推出空产生式,则FIRST(α)∩FOLLOW(A)=Φ.

2. 简述

LL(1)分析法是一种预测分析法。它使用一个栈,栈底为#。如果栈顶和下一个字符可以形成推导,即在一张分析表里找到表达式(预测在此情况下用这个表达式),就将表达式的右部逆序压进栈(来分析最左边的符号)。如果下一个字符和栈顶匹配,则开始读下下个字符。可以看到,这个方法的关键在于如何构建分析表。

分析表求法:

文法

求每条产生式求FIRST集和FOLLOW集

对应填进表里,一般先用FIRST集,如果为空,用FOLLOW集


2. 自底向上

如果说自顶向下分析的重点在于选择哪条语句,那么自底向上分析就在于规约哪些终结符。

对于第一第二个方法,首先定义什么是优先。在自底向上中,可能会出现一些挨在一起的字符恰好能用表达式规约,但实际上它们在语法树的不同深度。为了解决这一问题,我们从语法出发,定义应当先被规约的字符,也就是叶子节点,优先于后被规约的字符。

注意这里的优先是有严格顺序的,如果a先于b被规约,那么说a>b,但这不意味着b

对于(a),Si>Sj;对于(b),Si=Sj;对于(c),Sij;这些比较是针对某个特定语法树的相邻两个符号而言,不相邻没什么研究意义,而换一个语法树可能大小关系就发生变换。当然,我们不喜欢这种语法。

接下来考虑分析的过程。现在我们知道了两个相邻符号的大小关系。假设句子的某一段相邻关系长成这样:...<<==>>>...,那么中间那一段就应该被规约了。依旧引入一个栈,栈底为#,存放正在分析的符号。如果下一个符号小于等于栈顶,入栈;如果大于栈顶,找到前一个小于号,将中间部分规约。

可以想象程序里会出现一坨map

对于不同的分析表,引入简单优先分析和算符优先分析。


1. 简单优先分析

也就是上面描述的那个规约过程,从中可以看出,应该对于所有的终结符和非终结符构建分析表。

不太好构建,硬编出点句子看吧。


2. 算符优先分析

 简单优先分析分类太过细致,事实上有些比较是不必要的。例如(A+B)中,我们知道+的优先级最高,括号的优先级相等,至于具体的A和B是什么实际上不重要。这种想法引出了算符优先分析,即只关心终结符之间的优先级。为了能够使用这种简洁的分析,又对文法进行了一些规定:表达式右部最多只能有一个非终结符,不然我们就不得不考虑非终结符之间的优先级了。

尾:优先函数

如果用二维数组来存储分析表可能会花费太多空间,我们希望存在一个函数,将符号映射后保持其大小关系,也就是优先函数。优先函数有两种构造方法,一是Bell方法,二是Floyd方法。(拼起来就能求最短路了是吧)

Bell方法:对每个符号进行拆点操作,拆成f和g,分别对应其在符号左边和右边的情况。接下来对于分析表里的内容,以朝大于号开口的点为起点,另一个为终点连一条边。最终值为该点闭包大小。

Floyd方法:初始时为每个值都设为1,然后多次遍历分析表。碰到大小关系就令大的比小的大1,直到值不变为止。



 以上方法都对文法本身有很多限制,1965年,D.Knuth提出了LR(k)分析技术,意为从左到右,使用最右推导,每次看k个输入符号就能判断下一步动作,事实上LR和之前LL的意思是一样的(

其对语法作了更细致的分析,构建了分析动作表和状态转移表。分析动作表将语法分析的过程分为不同状态,设计了每个状态碰到一个终结符应该做什么;状态转移表是说当发生规约或新加一个非终结符号时转移到的下一状态。当状态转移到accepted的时候,说明分析成功。意会一下就是分析动作表针对终结符,状态转移表针对非终结符。

介于我们都是一个符号一个符号读入,所以把所有推导式细分为读到哪一个字符的状态,在读完的字符后加一个点。每一个状态叫项目(item),另外给推导式里加上S'->S,构成所谓的项目集规范族:

接下来将这个规范族里的项目分成几类,也就是我们所说的状态。这个过程和NFA确定化很像,都是从一些结点出发,求其闭包,即能推出哪些东西。再根据现有状态,读入下一个字符,形成接下来若干个状态。

然后把推的过程写成表格,就是分析表了。终结状态用r表示,下标就是那个表达式在题目里的顺序。。。

或者有的题会要求画DFA。


3. LR(0)分析法

先推荐一个蛮好玩的网站:LR(0) Parser Visualization

 当上面那个表能填出来的时候,它就是LR(0)文法了。


4. SLR(1)分析法

SLR的S是simple,意为那个表冲突时,可以根据FOLLOW集和往后看一个字符来唯一确定用哪个表达式。在判断是否为SLR(1)文法时,需要判断有公共前缀的几个表达式FOLLOW集是否有交集。

 



推荐阅读
  • 本文详细分析了JSP(JavaServer Pages)技术的主要优点和缺点,帮助开发者更好地理解其适用场景及潜在挑战。JSP作为一种服务器端技术,广泛应用于Web开发中。 ... [详细]
  • 本文总结了2018年的关键成就,包括职业变动、购车、考取驾照等重要事件,并分享了读书、工作、家庭和朋友方面的感悟。同时,展望2019年,制定了健康、软实力提升和技术学习的具体目标。 ... [详细]
  • 使用C#开发SQL Server存储过程的指南
    本文介绍如何利用C#在SQL Server中创建存储过程,涵盖背景、步骤和应用场景,旨在帮助开发者更好地理解和应用这一技术。 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 在Ubuntu 16.04 LTS上配置Qt Creator开发环境
    本文详细介绍了如何在Ubuntu 16.04 LTS系统中安装和配置Qt Creator,涵盖了从下载到安装的全过程,并提供了常见问题的解决方案。 ... [详细]
  • 在当前众多持久层框架中,MyBatis(前身为iBatis)凭借其轻量级、易用性和对SQL的直接支持,成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]
  • XNA 3.0 游戏编程:从 XML 文件加载数据
    本文介绍如何在 XNA 3.0 游戏项目中从 XML 文件加载数据。我们将探讨如何将 XML 数据序列化为二进制文件,并通过内容管道加载到游戏中。此外,还会涉及自定义类型读取器和写入器的实现。 ... [详细]
  • 360SRC安全应急响应:从漏洞提交到修复的全过程
    本文详细介绍了360SRC平台处理一起关键安全事件的过程,涵盖从漏洞提交、验证、排查到最终修复的各个环节。通过这一案例,展示了360在安全应急响应方面的专业能力和严谨态度。 ... [详细]
  • 本文深入探讨了Linux系统中网卡绑定(bonding)的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡,实现网络冗余、带宽聚合和负载均衡,在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]
  • 解读MySQL查询执行计划的详细指南
    本文旨在帮助开发者和数据库管理员深入了解如何解读MySQL查询执行计划。通过详细的解析,您将掌握优化查询性能的关键技巧,了解各种访问类型和额外信息的含义。 ... [详细]
  • 本文详细介绍了macOS系统的核心组件,包括如何管理其安全特性——系统完整性保护(SIP),并探讨了不同版本的更新亮点。对于使用macOS系统的用户来说,了解这些信息有助于更好地管理和优化系统性能。 ... [详细]
  • 从 .NET 转 Java 的自学之路:IO 流基础篇
    本文详细介绍了 Java 中的 IO 流,包括字节流和字符流的基本概念及其操作方式。探讨了如何处理不同类型的文件数据,并结合编码机制确保字符数据的正确读写。同时,文中还涵盖了装饰设计模式的应用,以及多种常见的 IO 操作实例。 ... [详细]
  • Google最新推出的嵌入AI技术的便携式相机Clips现已上架,旨在通过人工智能技术自动捕捉用户生活中值得纪念的时刻,帮助人们减少照片数量过多的问题。 ... [详细]
  • 本文探讨了 C++ 中普通数组和标准库类型 vector 的初始化方法。普通数组具有固定长度,而 vector 是一种可扩展的容器,允许动态调整大小。文章详细介绍了不同初始化方式及其应用场景,并提供了代码示例以加深理解。 ... [详细]
  • 解决微信电脑版无法刷朋友圈问题:使用安卓远程投屏方案
    在工作期间想要浏览微信和朋友圈却不太方便?虽然微信电脑版目前不支持直接刷朋友圈,但通过远程投屏技术,可以轻松实现在电脑上操作安卓设备的功能。 ... [详细]
author-avatar
吉之麟
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有