广东工业大学编译原理实验报告.docx

资源描述

广东工业大学编译原理实验报告.docx

《广东工业大学编译原理实验报告.docx》由会员分享，可在线阅读，更多相关《广东工业大学编译原理实验报告.docx（18页珍藏版）》请在冰豆网上搜索。

广东工业大学编译原理实验报告.docx

广东工业大学编译原理实验报告

实验报告

课程名称____编译原理__________

题目名称_PL/0编译程序的修改扩充_

学生学院______计算机学院__

专业班级_______________

学号

学生姓名______________

指导教师_______________

20年月日

一、课内实验要求

对PL/0作以下修改扩充：

增加单词：

保留字ELSE，FOR，TO，DOWNTO，RETURN

运算符*=，/=，++，--，&，||，！

修改单词：

不等号#改为<>

增加条件语句的ELSE子句，要求：

写出相关文法，语法图，语义规则。

二、实验环境与工具

计算机及操作系统：

PC机，Windows2000，WindowsXP

程序设计语言：

教学型编译程序：

PL/0

设计方案

概述：

源、目标语言，实现工具（平台），运行平台

源语言：

PASCAL

目标语言：

假想栈式计算机的汇编语言，可称为类PCODE指令代码

实现工具：

VisualC++6.0

运行平台：

Windows7

三、设计方案

1.结构设计说明

（1）PL/0语言编译器

PL/0语言可看成是PASCAL语言的子集，它的编译程序是一个编译解释执行系统。

PL/0的目标程序为假想栈式计算机的汇编语言，与具体计算机无关。

（2）PL/0编译程序的语法分析过程BLOCK是整个编译过程的核心。

这里根据编译程序的总体流程图，来弄清BLOCK过程在整个编译程序中的作用。

总流程图如下图所示：

PL/0的编译程序采用一趟扫描方式，以语法分析程序为核心，词法分析程序和代码生

成程序都作为一个独立的过程，当语法分析需要读单词时就用词法分析程序，而当语法分析

正确需生成相应的目标代码时，则调用代码生成程序。

此外，用表格管理程序建立变量，常

量和过程标识符的说明与引用之间的信息联系。

用出错处理程序对词法和语法分析遇到的错

误给出在源程序中出错的位置和错误性质。

（3）各功能模块描述

过程或函数名

简要功能说明

pl0

主程序

error

出错处理，打印出错位置和错误编码

getsym

词法分析，读取一个单词

getch

漏掉空格，读取一个字符

gen

生成目标代码，并送入目标程序区

test

测试当前单词符号是否合法

block

分程序分析处理过程

enter

登录名字表

position（函数）

查找标识符在名字表中的位置

constdeclaration

常量定义处理

vardeclaration

变量说明处理

listode

列出目标代码清单

statement

语句处理

expression

表达式处理

term

项处理

factor

因子处理

condition

条件处理

interpret

对目标代码的解释执行程序

base（函数）

通过静态链求出数据区的基地址

2、主要成分描述

符号表

为了组成一条指令，编译程序必须知道其操作码及其参数（数或地址）。

这些值是由编译程序本身联系到相应标识符上去的。

这种联系是在处理常数、变量和过程说明完成的。

为此，标识符表应包含每一标识符所联系的属性；如果标识符被说明为常数，其属性值为常数值；如果标识符被说明成变量，其属性就是由层次和修正量（偏移量）组成的地址；如果标识符被说明为过程，其属性就是过程的入口地址及层次。

常数的值由程序正文提供，编译的任务就是确定存放该值的地址。

我们选择顺序分配变量和代码的方法；每遇到一个变量说明，就将数据单元的下标加一（PL/0机中，每个变量占一个存贮单元）。

开始编译一个过程时，要对数据单元的下标dx赋初值，表示新开辟一个数据区。

dx的初值为3，因为每个数据区包含三个内部变量RA，DL和SL。

运行时存储组织和管理

对于源程序的每一个过程（包括主程序），在被调用时，首先在数据段中开辟三个空间，存放静态链SL、动态链DL和返回地址RA。

静态链记录了定义该过程的直接外过程（或主程序）运行时最新数据段的基地址。

动态链记录调用该过程前正在运行的过程的数据段基址。

返回地址记录了调用该过程时程序运行的断点位置。

对于主程序来说，SL、DL和RA的值均置为0。

静态链的功能是在一个子过程要引用它的直接或间接父过程（这里的父过程是按定义过程时的嵌套情况来定的，而不是按执行时的调用顺序定的）的变量时，可以通过静态链，跳过个数为层差的数据段，找到包含要引用的变量所在的数据段基址，然后通过偏移地址访问它。

在过程返回时，解释程序通过返回地址恢复指令指针的值到调用前的地址，通过当前段基址恢复数据段分配指针，通过动态链恢复局部段基址指针。

实现子过程的返回。

对于主程序来说，解释程序会遇到返回地址为0的情况，这时就认为程序运行结束。

解释程序过程中的base函数的功能，就是用于沿着静态链，向前查找相差指定层数的局部数据段基址。

这在使用sto、lod、stoArr、lodArr等访问局部变量的指令中会经常用到。

　　类PCODE代码解释执行的部分通过循环和简单的case判断不同的指令，做出相应的动作。

当遇到主程序中的返回指令时，指令指针会指到0位置，把这样一个条件作为终至循环的条件，保证程序运行可以正常的结束。

语法分析方法

语法分析子程序采用了自顶向下的递归子程序法，语法分析同时也根据程序的语义生成相应三元代码，并提供了出错处理的机制。

语法分析主要由分程序分析过程（BLOCK）、参数变量分析过程（ParaDeclaration）、参数变量处理过程（ParaGetSub）、数组处理过程（ParaGetSub）、常量定义分析过程（ConstDeclaration）、变量定义分析过程（Vardeclaration）、语句分析过程（Statement）、表达式处理过程（Expression）、项处理过程（Term）、因子处理过程（Factor）和条件处理过程（Condition）构成。

这些过程在结构上构成一个嵌套的层次结构。

除此之外，还有出错报告过程（Error）、代码生成过程（Gen）、测试单词合法性及出错恢复过程（Test）、登录名字表过程（Enter）、查询名字表函数（Position）以及列出类PCODE代码过程（Listcode）作过语法分析的辅助过程。

中间代码表示

目标代码类pcode是一种假想栈式计算机的汇编语言。

4、测试用例

1测试所有功能代码:

PROGRAMEX01;

VARA,B,C;

BEGIN

=9;

=6;

IFA<>bTHEN

WRITE（A）

READ（B）;

C=A+B*（3+B）;

WRITE（C）

END.

截图：

五、开发过程和完成情况

1.增加单词：

保留字ELSE，FOR，STEP，UNTIL，DO,RETURN

运算符*=，/=，&，||，！

增加5个保留字和5个运算符，合计10个单词。

其中保留字ELSE，FOR，TO，DOWNTO，RETURN分别对应

ELSESYM,FORSYM,STEPSYM,UNTILSYM,RETURNSYM,

运算符*=，/=，&，||，！

对应

TIMESBECOMES,SLASHBECOMES,ANDSYM,ORSYM,NOTSYM。

增加保留字

typedefenum{NUL,IDENT,NUMBER,PLUS,MINUS,TIMES,

SLASH,ODDSYM,EQL,NEQ,LSS,LEQ,GTR,GEQ,

LPAREN,RPAREN,COMMA,SEMICOLON,PERIOD,

BECOMES,BEGINSYM,ENDSYM,IFSYM,THENSYM,

WHILESYM,WRITESYM,READSYM,DOSYM,CALLSYM,

CONSTSYM,VARSYM,PROCSYM,PROGSYM,

ELSESYM,FORSYM,STEPSYM,UNTILSYM,RETURNSYM,

TIMESBECOMES,SLASHBECOMES,ANDSYM,ORSYM,NOTSYM

}SYMBOL;

char*SYMOUT[]={"NUL","IDENT","NUMBER","PLUS","MINUS","TIMES",

"SLASH","ODDSYM","EQL","NEQ","LSS","LEQ","GTR","GEQ",

"LPAREN","RPAREN","COMMA","SEMICOLON","PERIOD",

"BECOMES","BEGINSYM","ENDSYM","IFSYM","THENSYM",

"WHILESYM","WRITESYM","READSYM","DOSYM","CALLSYM",

"CONSTSYM","VARSYM","PROCSYM","PROGSYM",

"ELSESYM","FORSYM","STEPSYM","UNTILSYM","RETURNSYM",

"TIMESBECOMES","SLASHBECOMES","ANDSYM","ORSYM","NOTSYM"};

for（CH='';CH<='^';CH++）SSYM[CH]=NUL;

strcpy（KWORD[1],"BEGIN"）;strcpy（KWORD[2],"CALL"）;

strcpy（KWORD[3],"CONST"）;strcpy（KWORD[4],"DO"）;

strcpy（KWORD[5],"ELSE"）;strcpy（KWORD[6],"END"）;

strcpy（KWORD[7],"FOR"）;strcpy（KWORD[8],"IF"）;

strcpy（KWORD[9],"ODD"）;strcpy（KWORD[10],"PROCEDURE"）;

strcpy（KWORD[11],"PROGRAM"）;strcpy（KWORD[12],"READ"）;

strcpy（KWORD[13],"RETURN"）;strcpy（KWORD[14],"STEP"）;

strcpy（KWORD[15],"THEN"）;strcpy（KWORD[16],"UNTIL"）;

strcpy（KWORD[17],"VAR"）;strcpy（KWORD[18],"WHILE"）;

strcpy（KWORD[19],"WRITE"）;

WSYM[1]=BEGINSYM;WSYM[2]=CALLSYM;

WSYM[3]=CONSTSYM;WSYM[4]=DOSYM;

WSYM[5]=ELSESYM;WSYM[6]=ENDSYM;

WSYM[7]=FORSYM;WSYM[8]=IFSYM;

WSYM[9]=ODDSYM;WSYM[10]=PROCSYM;

WSYM[11]=PROGSYM;WSYM[12]=READSYM;

WSYM[13]=RETURNSYM;WSYM[14]=STEPSYM;

WSYM[15]=THENSYM;WSYM[16]=UNTILSYM;

WSYM[17]=VARSYM;WSYM[18]=WHILESYM;

WSYM[19]=WRITESYM;

SSYM['+']=PLUS;SSYM['-']=MINUS;

SSYM['*']=TIMES;SSYM['/']=SLASH;

SSYM['（']=LPAREN;SSYM['）']=RPAREN;

SSYM['=']=EQL;SSYM[',']=COMMA;

SSYM['.']=PERIOD;//SSYM['#']=NEQ;注释掉

SSYM[';']=SEMICOLON;SSYM['&']=ANDSYM;

SSYM['!

']=NOTSYM;

然后在STATEMENT（SYMSETFSYS,intLEV,int&TX）函数中增加：

caseFORSYM:

GetSym（）;

break;

caseTOSYM:

GetSym（）;

break;

caseDOWNTOSYM:

GetSym（）;

break;

caseRETURNSYM:

GetSym（）;

break;

增加运算符

在GetSym（）函数中增加：

else

if（CH=='*'）{

GetCh（）;

if（CH=='='）{

SYM=TIMESBECOMES;

GetCh（）;

}

elseSYM=TIMES;

}

else

if（CH=='/'）{

GetCh（）;

if（CH=='='）{

SYM=SLASHBECOMES;

GetCh（）;

}

elseSYM=SLASH;

}

else

if（CH=='&'）{

SYM=ANDSYM;

GetCh（）;

}

else

if（CH=='|'）{

GetCh（）;

if（CH=='|'）{

SYM=ORSYM;

GetCh（）;

}

elseError（19）;

}

else

if（CH=='!

'）{

SYM=NOTSYM;

GetCh（）;}

在voidSTATEMENT（SYMSETFSYS,intLEV,int&TX）{}函数中增加：

caseTIMESBECOMES:

GetSym（）;

Form1->printfs（"~~~~*=~~~~"）;

break;

caseSLASHBECOMES:

GetSym（）;

Form1->printfs（"~~~~/=~~~~"）;

break;

caseANDSYM:

GetSym（）;

Form1->printfs（"~~~~&~~~~"）;

break;

caseORSYM:

GetSym（）;

Form1->printfs（"~~~~||~~~~"）;

break;

caseNOTSYM:

GetSym（）;

Form1->printfs（"~~~~!

~~~~"）;

break;

保留字和单词的个数

原保留字个数是14，因为新增加保留字5个，故constNORW=14;

应改为：

constNORW=19;

原单词总数是33，因为新增加单词10个，故应将所有的33改为43就行了（Error（33）除外）。

2.修改单词：

不等号#改为<>

首先把源代码中的程序段SSYM['#']=NEQ;删除或注释消去。

然后在GetSym（）过程中把分析到的<>定义为不等号＃。

else

if（CH=='<'）{

GetCh（）;

if（CH=='='）{SYM=LEQ;GetCh（）;}

elseif（CH=='>'）{SYM=NEQ;GetCh（）;}

elseSYM=LSS;

}

else

if（CH=='>'）{

GetCh（）;

if（CH=='='）{SYM=GEQ;GetCh（）;}

elseSYM=GTR;

}

3.增加条件语句的ELSE子句，要求：

写出相关文法，语法图，语义规则。

（1）相关文法

G（S）:

S→ifSelseS|ifS|a

（2）语法图

（3）语义规则

产生式

语义规则

SifBthenMS1

{backpatch（E.truelist,M.quad）;

S.nextlist:

=merge（E.falselist,S1.nextlist）}

Mε

{M.quad:

=nextquad;}

Nε

{N.nextlist:

=makelist（nextquad）;

Gen（j,—,—,0）}

SifBthenM1S1

NelseM2S2

{backpatch（E.truelist,M1.quad）;

backpatch（E.falselist,M2.quad）;

S.nextlist:

=merge（S1.nextlist,

N.nextlist,S2.nextlist）}

（4）代码修改：

修改前：

caseIFSYM:

GetSym（）;

CONDITION（SymSetUnion（SymSetNew（THENSYM,DOSYM）,FSYS）,LEV,TX）;

if（SYM==THENSYM）GetSym（）;

elseError（16）;

CX1=CX;GEN（JPC,0,0）;

STATEMENT（FSYS,LEV,TX）;CODE[CX1].A=CX;

break;

修改后：

caseIFSYM:

GetSym（）;

CONDITION（SymSetUnion（SymSetNew（THENSYM,DOSYM）,FSYS）,LEV,TX）;

if（SYM==THENSYM）GetSym（）;

elseError（16）;

CX1=CX;GEN（JPC,0,0）;

STATEMENT（SymSetUnion（SymSetNew（ELSESYM）,FSYS）,LEV,TX）;

if（SYM!

=ELSESYM）CODE[CX1].A=CX;

else

{

GetSym（）;

CX2=CX;

GEN（JMP,0,0）;

CODE[CX1].A=CX;

STATEMENT（FSYS,LEV,TX）;

CODE[CX2].A=CX;

}

break;

六、小结

通过这个编译原理PL/0编译器的扩充，终于可以把课本的理论知识与实际问题结合起来。

一开始由于对编译原理的掌握还不足，以及自己的粗心大意，有些内容该改的没有改，导致程序死循环，花费了一段时间去查找错误，最后发现原因只是自己忽略了一些小细节。

其实有一部分原因是因为自己没有没有利用好只是去读懂程序。

所以，做这个实验要特别细心和周密的语法分析，不然很容易出错。

这次的实验对我做编译课程设计有很大的基础作用，使我对编译原理的了解更深了一层，也提高了自己的动手能力。

展开阅读全文