1、编译原理实验报告三实验三 语义分析程序实现一、实验目的与要求在实现词法、语法分析程序的基础上,编写相应的语义子程序,进行语义处理,加深对语法制导翻译原理的理解,进一步掌握将语法分析所识别的语法范畴变换为某种中间代码(四元式)的语义分析方法,并完成相关语义分析器的代码开发。二、一般实现方法语法制导翻译模式是在语法分析的基础上,增加语义操作来实现的,实际上是对前后文无关文法的一种扩展。一般而言,首先需要根据进行的语义分析工作,完成对给定文法的必要拆分和语义动作的编写,从而为每一个产生式都配备相应的语义子程序,以便在进行语法分析的同时进行语义解释。即在语法分析过程中,每当用一个产生式进行推导或归约时
2、,语法分析程序除执行相应的语法分析动作之外,还要调用相应的语义子程序,以便完成生成中间代码、查填有关表格、检查并报告源程序中的语义错误等工作。每个语义子程序需指明相应产生式中各个符号的具体含义,并规定使用该产生式进行分析时所应采取的语义动作。这样,语法制导翻译程序在对源程序从左到右进行的一遍扫描中,既完成语法分析任务,又完成语义分析和中间代码生成方面的工作。本实验要求从编译器的整体设计出发,重点通过对实验二中语法分析程序的扩展,完成一个编译器前端程序的编写、调试和测试工作,形成一个将源程序翻译为中间代码序列的编译系统。三、实验内容基本实验题目:对文法G2中的产生式添加语义处理子程序,完成运算对
3、象是简单变量(标识符)和无符号数的四则运算的计值处理,将输入的四则运算转换为四元式形式的中间代码。输入:包含测试用例(由标识符、无符号数和+、*、/、(、)构成的算术表达式)的源程序文件。输出:将源程序转换为中间代码形式表示,并将中间代码序列输出到文件中。若源程序中有错误,应指出错误信息。五、源程序# include # include # include # include # include # define UNKNOWN -1# define LB 0# define RB 1# define PL 2# define MI 3# define MU 4# define DI 5# d
4、efine UCON 6 /Suppose the class number of unsigned constant is 7# define OVER # define LT 8# define LE 9# define EQ 10# define NE 11# define GT 12# define GE 13# define IS 19/14至18被五个关键字占用# define ID 20#define MAX_KEY_NUMBER 20 /*关键字的数量*/#define KEY_WORD_END waiting for your expanding /*关键字结束标记*/cha
5、r *KeyWordTableMAX_KEY_NUMBER=begin,end, if, then, else, KEY_WORD_END;char TOKEN20=;/存储已扫描的单词char ch= ;/用于存储带判断的字符int row=1;/无符号数部分#define DIGIT 1#define POINT 2#define OTHER 3#define POWER 4#define PLUS 5#define MINUS 6#define ClassOther 200#define EndState -1int index=0;int w,n,p,e,d;int Class; /U
6、sed to indicate class of the wordint ICON;float FCON;static int CurrentState; /Used to present current state, the initial value:0/语法分析部分/产生式/ 1、E-E+T 2、E-E-T 3、E-T 4、T-T*F 5、T-T/F 6、T-F 7、F-(E) 8、F-i# define SMAX 256/goto表的列项# define E 0# define T 1# define F 2int StateStackSMAX;/状态栈int StackPoint;/
7、状态栈指针int TopState;/作为状态栈盏栈顶指针int InputWordType;/输入的单词类型/ ( ) + - * / i # char Action1684=s4, , , , , , s5, , , , s6, s7, , , , A, , r3, r3, r3, s8, s9, , r3, , r6, r6, r6, r6, r6, , r6, s4, , , , , , s5, , , r8, r8, r8, r8, r8, , r8, s4, , , , , , s5, , s4, , , , , , s5, , s4, , , , , , s5, , s4, ,
8、, , , , s5, , , s15, s6, s7, , , , , , r1, r1, r1, s8, s9, , r1, , r2, r2, r2, s8, s9, , r2, , r4, r4, r4, r4, r4, , r4, , r5, r5, r5, r5, r5, , r5, , r7, r7, r7, r7, r7, , r7,;/action表/ E T Fint Goto163= 1, 2, 3, -1, -1, -1, -1, -1, -1, -1, -1, -1, 10, 2, 3, -1, -1, -1, -1, 11, 3, -1, 12, 3, -1, -1
9、, 13, -1, -1, 14, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1,;/goto表/语义分析部分#define PMAX 5/define 后面不加括号,定义产生式符号属性字符串的长度int NXQ=0; /*全局变量NXQ用于指示所要产生的下一个四元式的编号*/int NXTemp=1;/整型变量NXTemp指示临时变量的编号int SentenceCount=1;/存放文件中句子的个数struct QUATERNION /*四元式表的结构*/ char opPMAX; /*操作符*
10、/ char arg1PMAX; /*第一个操作数*/ char arg2PMAX; /*第二个操作数*/ char resultPMAX; /*运算结果*/pQuad256; /*存放四元式的数组*/char EBracket_PlacePMAX;/(E)的语义属性char i_PlacePMAX;char E_PlacePMAX;char T_PlacePMAX;char F_PlacePMAX;int EXCUTE (int state, int symbol,FILE *fp,char JudgeStr,int row,int index);int GetChar (char ch);
11、int HandleError (char StrJudge,int row);int Push( int State );int Pop(int count);int SLRControl(FILE* fp);void GEN(char *Op, char *Arg1, char *Arg2, char *Result);char *NewTemp(void);void NextSentence(FILE* fp);/当语法或者词法产生错误的时候,跳过当前错误的句子,将文件指针指向下一个句子的开始/查保留字表,判断是否为关键字 int lookup (char *token) int n=0
12、; while (strcmp(KeyWordTablen, KEY_WORD_END) /strcmp比较两串是否相同,若相同返回0 if (!strcmp(KeyWordTablen, token) /比较token所指向的关键字和保留字表中哪个关键字相符 return n+1; /根据单词分类码表I,设置正确的关键字类别码,并返回此类别码的值 break; n+; return 6; /单词不是关键字,而是标识符/输出分析结果void out (int i, char* pStr) char Mnemonic5; if(0=i) strcpy(Mnemonic,LB); else if(
13、1=i) strcpy(Mnemonic,RB); else if(2=i) strcpy(Mnemonic,PL); else if(3=i) strcpy(Mnemonic,MI); else if(4=i) strcpy(Mnemonic,MU); else if(5=i) strcpy(Mnemonic,DI); else if(6=i) strcpy(Mnemonic,UCON); else if(7=i) strcpy(Mnemonic,OVER); else if(8=i) strcpy(Mnemonic,LT); else if(9=i) strcpy(Mnemonic,LE)
14、; else if(10=i) strcpy(Mnemonic,EQ); else if(11=i) strcpy(Mnemonic,NE); else if(12=i) strcpy(Mnemonic,GT); else if(13=i) strcpy(Mnemonic,GE); else if(14=i) strcpy(Mnemonic,BEGIN); else if(15=i) strcpy(Mnemonic,END); else if(16=i) strcpy(Mnemonic,IF); else if(17=i) strcpy(Mnemonic,THEN); else if(18=i
15、) strcpy(Mnemonic,ELSE); else if(19=i) strcpy(Mnemonic,IS); else if(20=i) strcpy(Mnemonic,ID); else strcpy(Mnemonic,Unkown Type); printf(%s )对应 %sn,Mnemonic,pStr);/报错部分void report_error (int row) printf(%s 无法识别的单词! In the %d rown,TOKEN,row);/扫描程序部分void scanner(FILE *fp) int i, c; fseek(fp,-1,1);/首先回
16、溯一个字符,就是将文件所有的字符都在scanner内部判断,外部while循环不会浪费任何字符 ch=fgetc (fp);/scanner中要想判断字符,必须开头先读一个字符 while( =ch|n=ch|t=ch)/消耗文件中空字符串 if(n=ch) row+; ch=fgetc (fp); if(EOF=ch) return; if (isalpha (ch) /*it must be a identifer!*/ TOKEN0=ch; ch=fgetc (fp); i=1; while (isalnum (ch) TOKENi=ch; i+; ch=fgetc (fp); TOKE
17、Ni= 0; fseek(fp,-1,1); /* retract*/ c=lookup (TOKEN); if (c!=6) out (c+13,TOKEN); else out (c+14,TOKEN);/此处加13或者14因为一些常量的定义产生冲突,被迫修改以适应 else if(isdigit(ch)| .=ch) fseek (fp,-1,1);/回溯一个字符,为下面循环内部使用先读字符后判断的格式。 int Type; CurrentState=0; i=0; do ch=fgetc(fp); TOKENi=ch; i+; TOKENi=0; Type=GetChar(ch); E
18、XCUTE (CurrentState,Type,fp,TOKEN,row,i); while(CurrentState!=EndState); else switch(ch) case : ch=fgetc(fp); if(ch=)out(LE,) out (NE,); else out (LT,: ch=fgetc(fp); if(ch=)out(GE,=); else out(GT,); break; case +: InputWordType=PL; out(PL,+); break; case -: InputWordType=MI; out(MI,-); break; case *
19、: InputWordType=MU; out(MU,*); break; case /: InputWordType=DI; out(DI,/); break; case (: InputWordType=LB; out(LB,(); break; case ): InputWordType=RB; out(RB,); break; case #: InputWordType=OVER; out(OVER,#); break; default: InputWordType=UNKNOWN; report_error(row); break; return;/无符号数判断矩阵执行程序int E
20、XCUTE (int state, int symbol,FILE *fp,char JudgeStr,int row,int index)/row用于指示出错的行数,index用于为待输出的字符串赋结束符0时用 switch (state) case 0:switch (symbol) case DIGIT: n=0;p=0;e=1;w=d;CurrentState=1;Class=UCON;break; case POINT: w=0;n=0;p=0;e=1;CurrentState=3;Class=UCON;break; default: Class=ClassOther; Curren
21、tState=EndState; InputWordType=UNKNOWN; printf(无符号数的第一个字符是非法的!n); break; case 1:switch (symbol) case DIGIT: w=w*10+d;break; /CurrentState=1 case POINT: CurrentState=2;break; case POWER: CurrentState=4;break; default: if (ch!=EOF)/如果是因为读到文件结束字符而终止识别(是正确识别一个无符号数结束),就不应该回退,否则可能造成死循环 fseek(fp,-1,1);/遇到其
22、他的字符,可能是一条语句中的其他字符,需后退,因为主函数外层循环每次都要读一个字符进行判断,而这个判读不回溯,所以在内部把这个多读的字符回溯 ICON=w;CurrentState=EndState; JudgeStrindex-1=0; InputWordType=UCON; printf(UCON,%i)对应 %sn,ICON,JudgeStr); break; break; case 2:switch (symbol) case DIGIT: n+;w=w*10+d;break; case POWER: CurrentState=4;break; default: if (ch!=EOF
23、) fseek(fp,-1,1); FCON=w*pow(10,e*p-n);CurrentState=EndState; JudgeStrindex-1=0; InputWordType=UCON; printf(UCON,%f)对应于 %sn,FCON,JudgeStr); break; case 3:switch (symbol) case DIGIT: n+;w=w*10+d;CurrentState=2;break; default: InputWordType=UNKNOWN; HandleError(JudgeStr,row);CurrentState=EndState; bre
24、ak; case 4:switch (symbol) case DIGIT: p=p*10+d;CurrentState=6;break; case MINUS: e=-1;CurrentState=5;break; case PLUS: CurrentState=5;break; default: InputWordType=UNKNOWN; HandleError(JudgeStr,row);CurrentState=EndState; break; case 5:switch (symbol) case DIGIT: p=p*10+d;CurrentState=6;break; default: InputWordType=UNKNOWN;/判断一个无符号数的最后一个字符应该都是多余读取的,所以为了防止引起后面再次判断下一无符号数时产生呑字符的现象,都应该回溯一个字符 HandleError(JudgeS
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1