《编译原理》课后习题答案-清华大学-第二版.doc

资源描述

《编译原理》课后习题答案-清华大学-第二版.doc

《《编译原理》课后习题答案-清华大学-第二版.doc》由会员分享，可在线阅读，更多相关《《编译原理》课后习题答案-清华大学-第二版.doc（171页珍藏版）》请在冰豆网上搜索。

《编译原理》课后习题答案-清华大学-第二版.doc

第1章引论

第1题

解释下列术语：

（1）编译程序

（2）源程序

（3）目标程序

（4）编译程序的前端

（5）后端

（6）遍

答案：

（1）编译程序：

如果源语言为高级语言，目标语言为某台计算机上的汇编语言或机器语言，则此翻译程序称为编译程序。

（2）源程序：

源语言编写的程序称为源程序。

（3）目标程序：

目标语言书写的程序称为目标程序。

（4）编译程序的前端：

它由这样一些阶段组成：

这些阶段的工作主要依赖于源语言而与目标机无关。

通常前端包括词法分析、语法分析、语义分析和中间代码生成这些阶段，某些优化工作也可在前端做，也包括与前端每个阶段相关的出错处理工作和符号表管理等工作。

（5）后端：

指那些依赖于目标机而一般不依赖源语言，只与中间代码有关的那些阶段，即目标代码生成，以及相关出错处理和符号表操作。

（6）遍：

是对源程序或其等价的中间语言程序从头到尾扫视并完成规定任务的过程。

第2题

一个典型的编译程序通常由哪些部分组成？

各部分的主要功能是什么？

并画出编译程序的总体结构图。

答案：

一个典型的编译程序通常包含8个组成部分，它们是词法分析程序、语法分析程序、语义分析程序、中间代码生成程序、中间代码优化程序、目标代码生成程序、表格管理程序和错误处理程序。

其各部分的主要功能简述如下。

词法分析程序：

输人源程序，拼单词、检查单词和分析单词，输出单词的机内表达形式。

语法分析程序：

检查源程序中存在的形式语法错误，输出错误处理信息。

语义分析程序：

进行语义检查和分析语义信息，并把分析的结果保存到各类语义信息表中。

中间代码生成程序：

按照语义规则，将语法分析程序分析出的语法单位转换成一定形式的中间语言代码，如三元式或四元式。

中间代码优化程序：

为了产生高质量的目标代码，对中间代码进行等价变换处理。

目标代码生成程序：

将优化后的中间代码程序转换成目标代码程序。

表格管理程序：

负责建立、填写和查找等一系列表格工作。

表格的作用是记录源程序的各类信息和编译各阶段的进展情况，编译的每个阶段所需信息多数都从表格中读取，产生的中间结果都记录在相应的表格中。

可以说整个编译过程就是造表、查表的工作过程。

需要指出的是，这里的“表格管理程序”并不意味着它就是一个独立的表格管理模块，而是指编译程序具有的表格管理功能。

错误处理程序：

处理和校正源程序中存在的词法、语法和语义错误。

当编译程序发现源程序中的错误时，错误处理程序负责报告出错的位置和错误性质等信息，同时对发现的错误

进行适当的校正（修复），目的是使编译程序能够继续向下进行分析和处理。

注意：

如果问编译程序有哪些主要构成成分，只要回答六部分就可以。

如果搞不清楚，就回答八部分。

第3题

何谓翻译程序、编译程序和解释程序？

它们三者之间有何种关系？

答案：

翻译程序是指将用某种语言编写的程序转换成另一种语言形式的程序的程序，如编译程序和汇编程序等。

编译程序是把用高级语言编写的源程序转换（加工）成与之等价的另一种用低级语言编写的目标程序的翻译程序。

解释程序是解释、执行高级语言源程序的程序。

解释方式一般分为两种：

一种方式是，源程序功能的实现完全由解释程序承担和完成，即每读出源程序的一条语句的第一个单词，则依据这个单词把控制转移到实现这条语句功能的程序部分，该部分负责完成这条语句的功能的实现，完成后返回到解释程序的总控部分再读人下一条语句继续进行解释、执行，如此反复；另一种方式是，一边翻译一边执行，即每读出源程序的一条语句，解释程序就将其翻译成一段机器指令并执行之，然后再读人下一条语句继续进行解释、执行，如此反复。

无论是哪种方式，其加工结果都是源程序的执行结果。

目前很多解释程序采取上述两种方式的综合实现方案，即先把源程序翻译成较容易解释执行的某种中间代码程序，然后集中解释执行中间代码程序，最后得到运行结果。

广义上讲，编译程序和解释程序都属于翻译程序，但它们的翻译方式不同，解释程序是边翻译（解释）边执行，不产生目标代码，输出源程序的运行结果。

而编译程序只负责把源程序翻译成目标程序，输出与源程序等价的目标程序，而目标程序的执行任务由操作系统来完成，即只翻译不执行。

第4题

对下列错误信息，请指出可能是编译的哪个阶段（词法分析、语法分析、语义分析、代码生成）报告的。

（1）else没有匹配的if

（2）数组下标越界

（3）使用的函数没有定义

（4）在数中出现非数字字符

答案：

（1）语法分析

（2）语义分析

（3）语法分析

（4）词法分析

第5题

编译程序大致有哪几种开发技术？

答案：

（1）自编译：

用某一高级语言书写其本身的编译程序。

（2）交叉编译：

A机器上的编译程序能产生B机器上的目标代码。

（3）自展：

首先确定一个非常简单的核心语言L0，用机器语言或汇编语言书写出它的编译程序T0，再把语言L0扩充到L1，此时L0⊂L1,并用L0编写L1的编译程序T1，再把语

言L1扩充为L2，有L1⊂L2,并用L1编写L2的编译程序T2，……，如此逐步扩展下去，

好似滚雪球一样，直到我们所要求的编译程序。

（4）移植：

将A机器上的某高级语言的编译程序搬到B机器上运行。

第６题

计算机执行用高级语言编写的程序有哪些途径?

它们之间的主要区别是什么?

答案：

计算机执行用高级语言编写的程序主要途径有两种，即解释与编译。

像Basic之类的语言，属于解释型的高级语言。

它们的特点是计算机并不事先对高级语言进行全盘翻译，将其变为机器代码，而是每读入一条高级语句，就用解释器将其翻译为一

条机器代码，予以执行，然后再读入下一条高级语句，翻译为机器代码，再执行，如此反复。

总而言之，是边翻译边执行。

像C，Pascal之类的语言，属于编译型的高级语言。

它们的特点是计算机事先对高级语言进行全盘翻译，将其全部变为机器代码，再统一执行，即先翻译，后执行。

从速度上看，编译型的高级语言比解释型的高级语言更快。

第2章PL/0编译程序的实现

第1题

PL/0语言允许过程嵌套定义和递归调用，试问它的编译程序如何解决运行时的存储管理。

答案：

PL/0语言允许过程嵌套定义和递归调用，它的编译程序在运行时采用了栈式动态存储管理。

（数组CODE存放的只读目标程序，它在运行时不改变。

）运行时的数据区S是由解释程序定义的一维整型数组，解释执行时对数据空间S的管理遵循后进先出规则，当每个过程（包括主程序）被调用时，才分配数据空间，退出过程时，则所分配的数据空间被释放。

应用动态链和静态链的方式分别解决递归调用和非局部变量的引用问题。

第2题

若PL/0编译程序运行时的存储分配策略采用栈式动态分配，并用动态链和静态链的方式分别解决递归调用和非局部变量的引用问题，试写出下列程序执行到赋值语句b∶=10时运行栈的布局示意图。

varx,y;procedurep;vara;procedureq;varb;begin（q）b∶=10;end（q）;procedures;varc,d;procedurer;vare,f;begin（r）callq;end（r）;begin（s）callr;end（s）;begin（p）calls;

end（p）;begin（main）callp;end（main）.

答案：

程序执行到赋值语句b∶=10时运行栈的布局示意图为：

第3题

写出题2中当程序编译到r的过程体时的名字表table的内容。

name

kind

level/val

adr

size

答案：

题2中当程序编译到r的过程体时的名字表table的内容为：

name

kind

level/val

adr

size

variable

dx+1

procedure

过程p的入口（待填）

variable

procedure

过程q的入口

procedure

过程s的入口（待填）

variable

procedure

过程r的入口

variable

dx+1

注意：

q和s是并列的过程，所以q定义的变量b被覆盖。

第4题

指出栈顶指针T，最新活动记录基地址指针B，动态链指针DL，静态链指针SL与返回地址RA的用途。

答案：

栈顶指针T，最新活动记录基地址指针B，动态链指针DL，静态链指针SL与返回地址

RA的用途说明如下：

T：

栈顶寄存器T指出了当前栈中最新分配的单元（T也是数组S的下标）。

B：

基址寄存器，指向每个过程被调用时，在数据区S中给它分配的数据段起始地址，也称基地址。

SL：

静态链，指向定义该过程的直接外过程（或主程序）运行时最新数据段的基地址，用以引用非局部（包围它的过程）变量时，寻找该变量的地址。

DL：

动态链，指向调用该过程前正在运行过程的数据段基地址，用以过程执行结束释放数据空间时，恢复调用该过程前运行栈的状态。

RA：

返回地址，记录调用该过程时目标程序的断点，即调用过程指令的下一条指令的地址，用以过程执行结束后返回调用过程时的下一条指令继续执行。

在每个过程被调用时在栈顶分配3个联系单元，用以存放SL，DL，RA。

第5题

PL/0编译程序所产生的目标代码是一种假想栈式计算机的汇编语言，请说明该汇编语言中下列指令各自的功能和所完成的操作。

（１）INT0A

（２）OPR00

（３）CALLA

答案：

PL/0编译程序所产生的目标代码中有3条非常重要的特殊指令，这3条指令在code中的位置和功能以及所完成的操作说明如下：

INT0A

在过程目标程序的入口处，开辟A个单元的数据段。

A为局部变量的个数+3。

OPR00

在过程目标程序的出口处，释放数据段（退栈），恢复调用该过程前正在运行的过程的数据段基址寄存器B和栈顶寄存器T的值，并将返回地址送到指令地址寄存器P中，以使调用前的程序从断点开始继续执行。

CALLA

调用过程，完成填写静态链、动态链、返回地址，给出被调用过程的基地址值，送入基址寄存器B中，目标程序的入口地址A的值送指令地址寄存器P中，使指令从A开始执行。

第6题

给出对PL/0语言作如下功能扩充时的语法图和EBNF的语法描述。

（1）扩充条件语句的功能使其为：

if〈条件〉then〈语句〉[else〈语句〉]

（2）扩充repeat语句为：

repeat〈语句〉{；〈语句〉}until〈条件〉

答案：

对PL/0语言作如下功能扩充时的语法图和EBNF的语法描述如下：

（1）扩充条件语句的语法图为：

EBNF的语法描述为：

〈条件语句〉:

=if〈条件〉then〈语句〉[else〈语句〉]

（2）扩充repeat语句的语法图为：

EBNF的语法描述为：

〈重复语句〉:

=repeat〈语句〉{；〈语句〉}until〈条件〉

第3章文法和语言

第1题

文法G＝（{A,B,S},{a,b,c},P,S）其中P为：

S→Ac|aB

A→ab

B→bc写出L（G[S]）的全部元素。

答案：

L（G[S]）={abc}

第2题

文法G[N]为：

N→D|ND

D→0|1|2|3|4|5|6|7|8|9

G[N]的语言是什么？

答案:

G[N]的语言是V+。

V={0,1,2,3,4,5,6,7,8,9}

N=>ND=>NDD....=>NDDDD...D=>D......D

或者：

允许0开头的非负整数？

第３题

为只包含数字、加号和减号的表达式，例如9-2＋5，3-1，７等构造一个文法。

答案：

G[S]:

S->S+D|S-D|D

D->0|1|2|3|4|5|6|7|8|9

第4题

已知文法G[Z]：

Z→aZb|ab

写出L（G[Z]）的全部元素。

答案：

Z=>aZb=>aaZbb=>aaa..Z...bbb=>aaa..ab...bbb

L（G[Z]）={ab|n>=1}

第5题写一文法，使其语言是偶正整数的集合。

要求：

（1）允许0打头；

（2）不允许0打头。

答案：

（1）允许0开头的偶正整数集合的文法

E→NT|D

T→NT|D

N→D|1|3|5|7|9

D→0|2|4|6|8

（2）不允许0开头的偶正整数集合的文法

E→NT|D

T→FT|G

N→D|1|3|5|7|9

D→2|4|6|8

F→N|0

G→D|0

第6题

已知文法G：

<表达式>:

=<项>｜<表达式>＋<项>

<项>:

=<因子>｜<项>*<因子>

<因子>:

=（<表达式>）｜i

试给出下述表达式的推导及语法树。

（５）i+（i+i）

（６）i+i*i

答案：

表达式

项

因子

表达式

项

因子

项

因子

项

因子

（

）

（5）<表达式>

=><表达式>＋<项>

=><表达式>＋<因子>

=><表达式>＋（<表达式>）

=><表达式>＋（<表达式>＋<项>）

=><表达式>＋（<表达式>＋<因子>）

=><表达式>＋（<表达式>＋i）=><表达式>＋（<项>＋i）

=><表达式>＋（<因子>＋i）

=><表达式>＋（i＋i）

=><项>＋（i＋i）

=><因子>＋（i＋i）

=>i＋（i＋i）

表达式

项

因子

项

因子

（6）<表达式>

=><表达式>＋<项>

=><表达式>＋<项>*<因子>

=><表达式>＋<项>*i

=><表达式>＋<因子>*i

=><表达式>＋i*i

=><项>＋i*i

=><因子>＋i*i

=>i＋i*i

第7题证明下述文法G[〈表达式〉]是二义的。

〈表达式〉∷=a|（〈表达式〉）|〈表达式〉〈运算符〉〈表达式〉

〈运算符〉∷=+|-|*|/

答案：

可为句子a+a*a构造两个不同的最右推导:

最右推导1〈表达式〉〈表达式〉〈运算符〉〈表达式〉〈表达式〉〈运算符〉a

〈表达式〉*a

〈表达式〉〈运算符〉〈表达式〉*a

〈表达式〉〈运算符〉a*a〈表达式〉+a*aa+a*a

最右推导2〈表达式〉〈表达式〉〈运算符〉〈表达式〉〈表达式〉〈运算符〉〈表达式〉〈运算符〉〈表达式〉

〈表达式〉〈运算符〉〈表达式〉〈运算符〉a

〈表达式〉〈运算符〉〈表达式〉*a

〈表达式〉〈运算符〉a*a〈表达式〉+a*aa+a*a

第8题

文法G[S]为：

S→Ac|aB

A→ab

B→bc

该文法是否为二义的？

为什么？

答案：

对于串abc

（1）S=>Ac=>abc

（2）S=>aB=>abc即存在两不同的最右推导。

所以，该文法是二义的。

或者：

对输入字符串abc，能构造两棵不同的语法树，所以它是二义的。

第9题

考虑下面上下文无关文法：

S→SS*|SS+|a

（1）表明通过此文法如何生成串aa+a*，并为该串构造语法树。

（2）G[S]的语言是什么？

答案：

（1）此文法生成串aa+a*的最右推导如下

S=>SS*=>SS*=>Sa*=>SS+a*=>Sa+a*=>aa+a*

（2）该文法生成的语言是：

*和+的后缀表达式，即逆波兰式。

第10题

文法S→S（S）S|ε

（1）生成的语言是什么？

（2）该文法是二义的吗？

说明理由。

答案：

（１）嵌套的括号

（２）是二义的，因为对于（）（）可以构造两棵不同的语法树。

第11题令文法G[E]为：

E→T|E+T|E-TT→F|T*F|T/F

F→（E）|i

证明E+T*F是它的一个句型，指出这个句型的所有短语、直接短语和句柄。

答案：

此句型对应语法树如右，故为此文法一个句型。

或者：

因为存在推导序列:

E=>E+T=>E+T*F，所以E+T*F句型

此句型相对于E的短语有:

E+T*F；相对于T的短语

有T*F

直接短语为：

T*F句柄为：

T*F

第13题

一个上下文无关文法生成句子abbaa的推导树如下：

（1）给出串abbaa最左推导、最右推导。

（2）该文法的产生式集合P可能有哪些元素？

（3）找出该句子的所有短语、直接短语、句柄。

a答案：

（1）串abbaa最左推导:

S=>ABS=>aBS=>aSBBS=>aBBS=>abBS=>abbS=>abbAa=>abbaa

最右推导：

S=>ABS=>ABAa=>ABaa=>ASBBaa=>ASBbaa=>ASbbaa=>Abbaa=>abbaa

（2）产生式有：

S→ABS|Aa|εA→aB→SBB|b可能元素有：

εaaababbaaaaabbaa……

（3）该句子的短语有：

a是相对A的短语ε是相对S的短语b是相对B的短语εbb是相对B的短语aa是相对S的短语aεbbaa是相对S的短语

直接短语有：

aεb

句柄是：

第14题

给出生成下述语言的上下文无关文法：

（1）{anbnambm|n，m>=0}

（2）{1n0m1m0n|n，m>=0}

（3）{WaWr|W属于{0|a}*，Wr表示W的逆}

答案：

（１）

S→AA

A→aAb|ε

（２）

S→1S0|A

A→0A1|ε

（３）

S→0S0|1S1|ε

第16题给出生成下述语言的三型文法：

（1）{an|n>=0}

（2）{anbm|n,m>=1}

（3）{anbmck|n,m,k>=0}

答案：

（1）S→aS|ε

（2）

S→aA

A→aA|B

B→bB|b

（3）

A→aA|B

B→bB|C

C→cC|ε

第17题

习题７和习题11中的文法等价吗？

答案：

等价。

第18题

解释下列术语和概念：

（１）字母表

（２）串、字和句子

（３）语言、语法和语义答案：

（１）字母表：

是一个非空有穷集合。

（２）串：

符号的有穷序列。

字：

字母表中的元素。

句子：

如果Zx,x+ ∈V*T则称x是文法G的一个句子。

（３）语言：

它是由句子组成的集合，是由一组记号所构成的集合。

程序设计的语言就是所有该语言的程序的全体。

语言可以看成在一个基本符号集上定义的，按一定规则构成的一切基本符号串组成的集合。

语法：

表示构成语言句子的各个记号之间的组合规律。

程序的结构或形式。

语义：

表示按照各种表示方法所表示的各个记

展开阅读全文