1、编译原理PL0课程设计报告编译原理PL0课程设计报告课 程 设 计 班级:21301学号:1361080108姓名:马瑞泽XX(8) (9) 其他典型语言设施:REPEAT 语句 UNTIL 语句三课程设计环境与工具(1)计算机及操作系统:PC机,Win7(2)实现工具:VC+ 6.0, C语言(3) 教学型编译程序:PL/0 四结构设计说明1) PL/0编译程序的结构图2) PL/0编译程序的过程或函数的功能表过程或函数名简要功能说明pl0主程序error出错处理,打印出错位置和错误编码getsym词法分析,读取一个单词getch漏掉空格,读取一个字符gen生成目标代码,并送入目标程序区te
2、st测试当前单词符号是否合法block分程序分析处理过程enter登录名字表position(函数)查找标识符在名字表中的位置constdeclaration常量定义处理vardeclaration变量说明处理listode列出目标代码清单statement语句处理expression表达式处理term项处理factor因子处理condition条件处理interpret对目标代码的解释执行程序base(函数)通过静态链求出数据区的基地址3) PL/0编译程序的总体流程图 4) 词法分析词法分析是编译的第一个阶段,它的主要任务是从左向右逐个字符地对源程序进行扫描,产生一个个单词序列用于语法分析
3、。PL/0词法分析程序GETSYM的功能是为语法分析提供单词用的,是语法分析的基础,把输入的字符串形式的源程序分割成一个个单词符号。经过词法分析程序分析出来的单词,对语言固有的单词只给出类别存放在全程变量SYM中,而对用户定义的单词(标识符或常数)既给出类别又给值,其类别放在SYM中,值放在全程变量ID或全程变量NUM中,全部单词种类由编译程序定义的纯量类型SYMBOL给出,称为语法词汇表。词法分析器的分析过程:调用GETSYM时,它通过GETCH过程从源程序中获得一个字符。如果这个字符是字母,则继续获取字符或数字,最终可以拼成一个单词,查保留字表,如果查到为保留字,则把SYM变量赋成相应的保
4、留字类型值;如果没有查到,则这个单词应是一个用户自定义的标识符(可能是变量名、常量名或是过程的名字),把SYM置为IDENT,把这个单词存入ID变量。查保留字表时使用了二分法查找以提高效率。如果Getch获得的字符是数字,则继续用Getch获取数字,并把它们拼成一个整数或实数,然后把SYM置为 INTEGER,并把拼成的数值放入NUM变量。如果识别出其它合法的符号(比如:赋值号、大于号、小于等于号等),则把SYM则成相应的类型。如果遇到不合法的字符,把SYM置成NUL。词法分析程序GETSYM将完成下列任务:(1)滤空格 (2)识别保留字 (3)识别标识符(4)拼数 (5)拼复合词 (6)输出
5、源程序5) 语法分析PL/0编译程序的语法分析采用了自顶向下的递归的子程序法。语法分析同时也根据程序的语义生成相应三元代码,并提供了出错处理的机制。语法分析主要由分程序分析过程(BLOCK)、常量定义分析过程(ConstDeclaration)、变量定义分析过程(Vardeclaration)、语句分析过程(Statement)、表达式处理过程(Expression)、项处理过程(Term)、因子处理过程(Factor)和条件处理过程(Condition)构成。这些过程在结构上构成一个嵌套的层次结构。除此之外,还有出错报告过程(Error)、代码生成过程(Gen)、测试单词合法性及出错恢复过程
6、(Test)、登录名字表过程(Enter)、查询名字表函数(Position)以及列出类 PCODE代码过程(Listcode)作过语法分析的辅助过程。由PL/0的语法图可知:一个完整的PL/0程序是由分程序和句号构成的。因此,本编译程序在运行的时候,通过主程序中调用分程序处理过程block来分析分程序部分(分程序分析过程中还可能会递归调用block过程),然后,判断最后读入的符号是否为句号。如果是句号且分程序分析中未出错,则是一个合法的PL/0程序,可以运行生成的代码,否则就说明源PL/0程序是不合法的,输出出错提示即可。6) 语义分析PL/0 的语义分析主要进行以下检查:(1) 是否存在标
7、识符先引用未声明的情况;(2) 是否存在己声明的标识符的错误引用;(3) 是否存在一般标识符的多重声明。7) 中间代码生成目标代码类pcode是一种假想栈式计算机的汇编语言。自己添加覆盖了OPR 0 14 栈顶值输出至屏幕(字符型)OPR 0 15 栈顶值输出至屏幕(整数型)OPR 0 16 栈顶值输出至屏幕(实数型)OPR 0 17 屏幕输出换行OPR 0 18 从命令行读入一个字符输入置于栈顶OPR 0 19 从命令行读入一个整数输入置于栈顶OPR 0 20 从命令行读入一个实数输入置于栈顶8) 语法错误处理PL/0编译程序对语法错误的处理采用两种办法:(1)对于一些易于校正的错误,如丢了
8、逗号、分号等,指出出错的位置,加以校正,继续进行分析。 (2)对于难于校正的错误,给出错误的位置与性质,跳过后面一些单词,直到下一个可以进行正常语法分析的语法单位。错误类型如下0 过程开始部分说明不正确1 常数说明中=写成:=2 常数说明中=后应为整数或实数或字符3 常数说明中的标识符后应是=4 const, var, procedure后应为标识符5 漏掉了,或;6 过程说明后的符号不正确(应该是语句开始符,或过程定义符)7 应是语句开始符8 程序体内语句部分的后跟符不正确9 程序结尾丢了句号.10 语句间漏了;11 标识符未说明12 赋值语句中,赋值号左部标识符属性应是变量13 变量后不能
9、是此符号14 call后应为标识符15 call后标识符属性应为过程16 条件语句中丢了then17 丢了end或;18 while型循环语句丢了do19 语句后的符号不正确20 应为关系运算符21 表达式内标识符属性不能是过程22 表达式中漏掉右括号(23 因子后的非法符号24 表达式的开始符不能是此符号31 数越界补充说明了:32 read或write语句括号中的标识符不是变量33 read或write语句缺少右括号)34 read或write语句缺少左括号(35 read或write括号里应为变量自己增加了:45 +或-后面应为变量46 repeat缺少until47 for语句错误48
10、 for语句缺少do49 类型值不匹配50 类型无法转换51 只有整数能+或-52 类型不正确五 设计过程(一) 实验内容1.增加单词:保留字 ELSE,FOR, TO, DOWNTO, REPEAT,UNTIL,RETURN运算符 +=(PLUSBK), -=(MINUSBK), +(INC), - (DEC)首先要扩展SYMBOL,在此基础上再进行其它细节的修改。要添加的SYMBOL为:typedef enum NUL, IDENT, NUMBER, PLUS, MINUS, TIMES, SLASH, ODDSYM, EQL, NEQ, LSS, LEQ, GTR, GEQ, LPARE
11、N, RPAREN, COMMA, SEMICOLON, PERIOD, BECOMES, BEGINSYM, ENDSYM, IFSYM, THENSYM, WHILESYM, WRITESYM, READSYM, DOSYM, CALLSYM, CONSTSYM, VARSYM, PROCSYM, PROGSYM, ELSESYM, FORSYM, TOSYM, DOWNTOSYM, REPEATSYM, UNTILSYM, RETURNSYM, PLUSBK, MINUSBK, INC, DEC SYMBOL;char *SYMOUT = NUL, IDENT, NUMBER, PLUS
12、, MINUS, TIMES, SLASH, ODDSYM, EQL, NEQ, LSS, LEQ, GTR, GEQ, LPAREN, RPAREN, COMMA, SEMICOLON, PERIOD, BECOMES, BEGINSYM, ENDSYM, IFSYM, THENSYM, WHILESYM, WRITESYM, READSYM, DOSYM, CALLSYM, CONSTSYM, VARSYM, PROCSYM, PROGSYM, ELSE,FOR, TO, DOWNTO, REPEAT, UNTIL, RETURN, PLUSBK, MINUSBK, INC” DEC ;其
13、中黑斜体为新加入的SYMBOL。再将ELSE,FOR,TO,DOWNTO,REPEAT, UNTIL, RETURN, PLUSBK, MINUSBK, INC,DEC关键字加到KWORD和将相应的SYM加到WSYM,按字母顺序排列。以及修改NEQ 后如下void _fastcall TForm1:ButtonRunClick(TObject *Sender) for (CH= ; CH=; CH+) SSYMCH=NUL; strcpy(KWORD 1,BEGIN); strcpy(KWORD 2,CALL); strcpy(KWORD 3,CONST); strcpy(KWORD 4,DE
14、C); strcpy(KWORD 5,DO); strcpy(KWORD 6, DOWHILE); strcpy(KWORD 7, DOWNTO ); strcpy(KWORD 8,ELSE); strcpy(KWORD 9,END); strcpy(KWORD 10,FOR); strcpy(KWORD 11,IF); strcpy(KWORD12,INC); strcpy(KWORD13,MINUSBK); strcpy(KWORD14,ODD); strcpy(KWORD15,PLUSBK); strcpy(KWORD16,PROCEDURE); strcpy(KWORD17,PROGR
15、AM); strcpy(KWORD18,READ); strcpy(KWORD19,REPEAT); strcpy(KWORD20,RETURN); strcpy(KWORD21,THEN); strcpy(KWORD22,TO); strcpy(KWORD23,VAR); strcpy(KWORD24,UNTIL);strcpy(KWORD25,WHILE); strcpy(KWORD26,WRITE); WSYM 1=BEGINSYM; WSYM 2=CALLSYM; WSYM 3=CONSTSYM; WSYM 4=DEC; WSYM 5=DOSYM; WSYM 6=DOWHILESYM;
16、 WSYM 7=DOWNTOSYMs; WSYM 8=ELSESYM; WSYM 9=ENDSYM; WSYM 10=FORSYM; WSYM 11=IFSYM; WSYM12=INCSYM; WSYM13=MINUSBK; WSYM14=ODDSYM; WSYM15=PLUSBK; WSYM16=PROCSYM; WSYM17=PROGSYM; WSYM18=READSYM; WSYM19=REPEATSYM; WSYM20=RETURNSYM; WSYM21=THENSYM; WSYM 22=TOSYM;WSYM23=VARSYM; WSYM24=UNTILSYM; WSYM25=WHIL
17、ESYM; WSYM26=WRITESYM; SSYM+=PLUS; SSYM-=MINUS; SSYM*=TIMES; SSYM/=SLASH; SSYM(=LPAREN; SSYM)=RPAREN; SSYM=EQL; SSYM,=COMMA; SSYM.=PERIOD; SSYM;=SEMICOLON;因为关键字增加到了26个,所以令const NORW = 26;SYMBOL由原来的33个值扩展为目前的44个值,SYMOUT也由原来的33个元素扩展为目前的44个元素.我用个SYMMAX来记录SYMBOL值的个数, 所以,除了Error函数中可能出现的作为参数的“33”不被替换为“44”
18、外,其余的“33”均用“SYMMAX”来替换。SYMBOL扩展完毕。2. 修改单词:不等号# 改为 只要修改GetSym()函数。当编译器检测到当前字符为“”时,接着检测下一个字符,如果是“”,则使SYM=NEQ。代码修改如下:if (CH=) SYM=NEQ; GetCh (); /增加为不等于号;else SYM=LSS; 3. 增加条件语句的ELSE子句 该条件语法描述图如下:语句只要在STATEMENT修改如下代码: case IFSYM: GetSym(); CONDITION(SymSetUnion(SymSetNew(THENSYM,DOSYM),FSYS),LEV,TX); i
19、f (SYM=THENSYM) GetSym(); else Error(16); CX1=CX; GEN(JPC,0,0); STATEMENT(SymSetUnion(SymSetNew(ELSESYM), FSYS), LEV, TX); if(SYM != ELSESYM) CODECX1.A=CX; /如果程序中没有else语句,执行JPC时跳到此地址 else /添加ELSE语句 GetSym(); CX2=CX; GEN(JMP,0,0); /跳过else语句 CODECX1.A = CX; /如果程序中有else语句,执行JPC时跳到此地址 STATEMENT(FSYS,LEV
20、,TX); CODECX2.A = CX; /执行完then语句后跳出 break;ELSE子句扩充完毕。(二) 课程设计内容1. 增加运算符 +=,-=,+,-a) 词法分析1) 在GetSym()中完成INC()、PLUSBK()的词法分析,代码修改如下:else if(CH = +) GetCh(); if(CH = =) /增加+= SYM = PLUSBK; GetCh(); else if(CH = +) /增加+ SYM = INC; GetCh(); else SYM = PLUS; 2) 在GetSym()中完成DEC()、MINUSBK()的词法分析,代码修改如下:else
21、 if(CH = -) GetCh(); if(CH = =) /增加-= SYM = MINUSBK; GetCh(); else if(CH = -) /增加- SYM = DEC; GetCh(); else SYM = MINUS; b)扩充 后+ 和 后- 操作存在INC和DEC操作的语法图有如下两个:根据以上语法图,我们只要对语句处理程序和因子处理程序进行修改添加,即可实现增加 后INC 和 后DEC 操作,首先对语句处理程序STATEMENT进行如下修改:Case IDENT: i=POSITION (ID,TX); if (i=0) Error(11); else if (TA
22、BLEi.KIND!=VARIABLE) /*ASSIGNMENT TO NON-VARIABLE*/ Error(12); i=0; GetSym(); if (SYM=BECOMES) GetSym (); EXPRESSION (FSYS, LEV, TX); if (i!=0) GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); else if (SYM=INC) /语句中的+运算 if (i!=0) GEN(LOD,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GEN(LIT,0,1); GEN(OPR,0,2); if
23、(i!=0) GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GetSym(); else if (SYM=DEC) /语句中的-运算 if (i!=0) GEN(LOD,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GEN (LIT,0,1); GEN (OPR,0,3); if (i!=0) GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GetSym (); 在接受到SYM=IDENT后,如果SYM为INC,则主要执行这四条指令:GEN(LOD,LEV-TABLEi.vp.LEVEL
24、,TABLEi.vp.ADR) 将IDENT的值放到栈顶,GEN(LIT,0,1); 将常数1放到栈顶,GEN(OPR,0,2) 次栈顶加栈顶,GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR);将栈顶内容保存到IDENT中。这样就完成了语句中的+运算。如果SYM为DEC,则主要执行这四条指令:GEN(LOD,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR) 将IDENT的值放到栈顶,GEN(LIT,0,1); 将常数1放到栈顶,GEN(OPR,0,3) 次栈顶减栈顶,GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.v
25、p.ADR);将栈顶内容保存到IDENT中。这样就完成了语句中的-运算。其次,再对因子处理程序FACTOR修改如下:if (SYM=IDENT) i=POSITION(ID,TX); if (i=0) Error(11); else switch (TABLEi.KIND) case CONSTANT: GEN(LIT,0,TABLEi.VAL);GetSym(); break; case VARIABLE: GEN(LOD,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GetSym(); if(SYM=INC|SYM=DEC) /因子中的+和-运算 GEN(LIT,
26、0,1); if(SYM=INC) GEN(OPR,0,2);/如果为INC,则加1 else GEN(OPR,0,3);/否则减一 GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR);/将栈顶送入变量单元 GEN(LOD,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); /将变量送入栈顶 GetSym(); break; case PROCEDUR: Error(21); break; 这样,对 后INC 和 后DEC操作就扩充完成c)扩充 前+ 和 前- 操作存在 前INC 和 前DEC 操作的语法图有如下两个: 首先将 STATBE
27、GSYSINC=1; STATBEGSYSDEC=1; FACBEGSYSINC =1; FACBEGSYSDEC =1;其次根据以上语法图,我们只要对语句处理程序和因子处理程序进行修改添加,即可实现增加 前INC 和 前DEC 操作,首先对语句处理程序STATEMENT进行如下修改:case INC: /前+ GetSym(); if (SYM = IDENT) i=POSITION(ID,TX); if (i=0) Error(11); else if (TABLEi.KIND!=VARIABLE) /*ASSIGNMENT TO NON-VARIABLE*/ Error(12); i=0
28、; if (i!=0) GEN(LOD,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GEN(LIT,0,1); GEN(OPR,0,2); if (i!=0) GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GetSym(); else Error(45); break; case DEC: /前- GetSym(); if (SYM = IDENT) i=POSITION(ID,TX); if (i=0) Error(11); else if (TABLEi.KIND!=VARIABLE) /*ASSIGNMENT TO NON-VARIABLE*/ Error(12); i=0; if (i!=0) GEN(LOD,LEV-TABLEi.vp.LEVEL,TABLEi.vp.ADR); GEN (LIT,0,1); GEN (OPR,0,3); if (i!=0) GEN(STO,LEV-TABLEi.vp.LEVEL,TABLEi.v
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1