ImageVerifierCode 换一换
格式:DOCX , 页数:34 ,大小:52.39KB ,
资源ID:12625020      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/12625020.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(编译原理课程设计实验报告.docx)为本站会员(b****3)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

编译原理课程设计实验报告.docx

1、编译原理课程设计实验报告编译原理课程设计实验报告实验目的:这个实验的目的是构造C minus语言的编译器,要求能够编译C minus语言的程序并且生成中间代码。在实验的过程中,学会使用flex/bison这两个重要的工具。实验内容: 参见教材 p491 appendix A.设计一cminus语言编译器语言介绍。Decaf(cminus)语言的关键字:int while if else return void运算符:+ - * / = , . != = = () C minus语言的限制。数字:支持10进制整数。小数可以采用科学记数法,如1E3也是合法的。字符串:字符串内部不允许出现换行,即字

2、符串变量必须在同一行内。注释:C minus语言允许采用/*/注释,并且注释不可以嵌套,即下面的注释是不合法的:/*This is /*a valid */comment*/程序流程图程序的流程参照了书本TINY编译器的实例程序:语法分析器(Parser)调用词法分析器得到符合词法的字,建立语法树;符号表通过对语法树的分析,建立符号表,同时检查变量未定义等错误;类型检查包括检查表达式两边是否匹配,函数参数是否匹配等等;经由上述步骤而未出错的源程序被认为是合法程序,然后代码生成通过语法树和符号表生成P Code中间代码,并将变量地址存入符号表。其中类型检查和代码生成不要求实现。本次实验要求分组,

3、一组五人,一人完成一个部分。本组实验分组成员以及分工介绍:汪晨风:(设计并实现cminus符号表);E02620105蔡其星:(编写cminus.l文件,并用lex工具生成c代码);E02620107赵婷:(设计cminus语法树结构);E02620106马培良:编写cminus.y文件,并用yacc工具生成可执行代码);E02620121丘廷:(进行程序的测试)以下为具体实验分步报告以及过程:第一部分:设计cminus符号表符号表是编译器中的主要继承属性,并且在语法树之后,形成了主要的数据结构。符号表主要的操作有插入、查找和删除。杂凑表(hash表)通常为符号表的实现提供了最好的选择,因为所

4、有3种操作都能在几乎恒定的时间内完成,在实践中也是最常使用。该课程设计所用的C-符号表采用建立杂凑表的方法。杂凑表是一个入口数组,称作“桶( b u c k e t )”,使用一个整数范围的索引,通常从0到表的尺寸减1。杂凑函数(hash fuction)把索引键(在这种情况下是标识符名,组成一个字符串)转换成索引范围内的一个整数的杂凑值,对应于索引键的项存储在这个索引的“桶”中。每个“桶”实际上又是一个线性表,通过把新的项插入到“桶”表中来解决冲突在任何情况下,“桶”数组的实际大小要选择一个素数,因为这将使一般的杂凑函数运行得更好。杂凑函数。在符号表实现中使用的杂凑函数将字符串(标识符名)转

5、换成0. . . s i z e- 1范围内的一个整数。一般这通过3步来进行。首先,字符串中的每个字符转换成一个非负整数。然后,这些整数用一定的方法组合形成一个整数。最后,把结果整数调整到0. . . s i z e- 1范围内。冲突的一个好的解决办法是,当加上下一个字符的值时,重复地使用一个常量作为乘法因子。因此,如果ci 是第i 个字符的数字值, hi 是在第i 步计算的部分杂凑值,那么hi 根据下面的递归公式计算,h0 = 0,hi 1 = ahi ci ,最后的杂凑值用h = hn m o d s i z e计算。这里n 是杂凑的名字中字符的个数。这等价于下列公式当然,在这个公式中a的

6、选择对输出结果有重要影响。a的一种合理的选择是2的幂,如1 6或1 2 8,这样乘法可以通过移位来完成。该程序a选16,s i z e 取211。由于在数据结构方面为了实现很方便的进行查找,插入,删除等操作。我们把它的数据结构设计成一哈稀表结构,哈稀表的查找,插入等操作是飞快的。我们所设计的哈稀结构符号表是参考教科书上P295它的结构如下:符号表的杂凑函数#define SIZE 211#define SHIFT 4int hash ( char * key ) int temp = 0;int i = 0;while (keyi != 0) temp = (temp SHIFT) + key

7、i) % SIZE;+ + i ;return temp;该符号表完成了插入void st_insert( char * name, int lineno, int loc )、查找int st_lookup ( char * name )工作源程序:symtab.c#include #include #include #include symtab.h/* 定义哈稀表的最大值 */#define SIZE 211/* SHIFT is the power of two used as multiplier in hash function */#define SHIFT 4/* 哈稀函数结构

8、 */static int hash ( char * key ) int temp = 0; int i = 0; while (keyi != 0) temp = (temp name) != 0) l = l-next; if (l = NULL) /* variable not yet in table */ l = (BucketList) malloc(sizeof(struct BucketListRec); l-name = name; l-lines = (LineList) malloc(sizeof(struct LineListRec); l-lines-lineno

9、= lineno; l-memloc = loc; l-lines-next = NULL; l-next = hashTableh; hashTableh = l; else /* found in table, so just add line number */ LineList t = l-lines; while (t-next != NULL) t = t-next; t-next = (LineList) malloc(sizeof(struct LineListRec); t-next-lineno = lineno; t-next-next = NULL; int st_lo

10、okup ( char * name ) int h = hash(name); BucketList l = hashTableh; while (l != NULL) & (strcmp(name,l-name) != 0) l = l-next; if (l = NULL) return -1; else return l-memloc; void printSymTab(FILE * listing) int i; fprintf(listing,Variable Name Location Line Numbersn); fprintf(listing,- - -n); for (i

11、=0;ilines; fprintf(listing,%-14s ,l-name); fprintf(listing,%-8d ,l-memloc); while (t != NULL) fprintf(listing,%4d ,t-lineno); t = t-next; fprintf(listing,n); l = l-next; /* printSymTab */symtab.h#ifndef _SYMTAB_H_#define _SYMTAB_H_void st_insert( char * name, int lineno, int loc ); /*插入函数*/int st_lo

12、okup ( char * name ); /*查找函数*/void printSymTab(FILE * listing); /*用来打印哈稀表内容*/#endif 符号表设计的好坏直接影响到整个程序运行的速度,效率以及准确度。因为接下来的parse工作是基于符号表的,是从符号表里提取token进行语法分析的。为了提高程序运行的的效率,我们把scan直接通过parse来调用。具体的来讲就是,程序运行时,首先进入parse部分,当parse要用到token时,调用scan部分扫描原文件生成token储存在符号表中,并同时提供给parse进行语法分析。这样就可以一遍完成整个原文件的扫描。第二部分

13、:运用LEX实现cminus词法分析程序。这一部比较关键,设计的正确与否直接影响到在scan过程中token的产生。以及整个程序运行的结果的正确与否。在这里主要定义cminus的基本语法规则,以及token类型,运算符类型,并且定义cminus关键字,便于在程序运行时能对其进行识别。一下为cminus.l文件原代码:/*定义全局变量、函数及包含文件说明:*/%#include globals.h #include util.h#include scan.h #define MAXTOKENLEN 40char tokenString40;int lineno = 0;%/*有关语法规则以及to

14、ken的定义:*/digit 0-9number digit+letter a-zA-Zidentifier letter+newline nwhitespace t+%/*以下为关键字定义:*/if return IF;else return ELSE;int return INT;void return VOID;return return RETURN;while return WHILE;/*以下为运算符号定义:*/= return ASSIGN;= return GTEQ; return GT;= return EQ;!= return NOTEQ;+ return PLUS;- r

15、eturn MINUS;* return TIMES;/ return OVER;( return LPAREN;) return RPAREN; return LBRACK; return RBRACK; return LCURL; return RCURL; return SEMI;, return COMMA;/*终结符及注释符号*/number return NUM;identifier return ID;newline lineno+;whitespace /* skip whitespace */* char c;char d; c = input(); if (c != EOF

16、) do d = c; c = input(); if (c = EOF) break; if (c = n) lineno+; while (!(d = * & c = /); . return ERROR;%/*定义getToken()函数体:*/TokenType getToken(void) static int firstTime = TRUE; TokenType currentToken; if (firstTime) firstTime = FALSE; lineno+; yyin = source; yyout = listing; currentToken = yylex(

17、); strncpy(tokenString,yytext,MAXTOKENLEN); if (TraceScan) fprintf(listing,t%d: ,lineno); printToken(currentToken,tokenString); return currentToken;说明:以上代码已经能通过lex工具产生c代码。cminus.l的设计基本结构是参考tiny.l的结构设计而成,但要注意的是,由于在接下来的cnimus.y中所定义的语法规则不同,这里的也要稍做修改。比如在这里的getToken函数,要于cminus.y文件里的设计的返回参数要一一对应,否则在编译的过程中

18、会出现类型不匹配等等的错误,修改起来比较麻烦。 第三部分:为C-设计语法树结构,使之适用于分析器产生语法树是LALR分析的前提。因此在进行语法分析之前,必须设计语法树结构,使接下来的语法分析有一个具体的数据结构。其代码段如下:#define MAXTOKENSIZE 50typedef int TokenType; /*定义语法树结构*/typedef struct TokenType tok; char * tokString; TokenStruct;typedef enum IfK,WhileK,AssignK,ReturnK,CallK,VarDeclK,FunDeclK,OpK,Co

19、nstK,IdK NodeKind; /*枚举结点类型*/typedef enum Void,Integer,Boolean ExpType; /*枚举返回变量类型*/#define MAXCHILDREN 3 /*声明一个结点最多有三个子结点*/typedef struct treeNode /*定义语法树结点结构*/ struct treeNode * childMAXCHILDREN; struct treeNode * sibling; int lineno; NodeKind kind; union TokenType op; int val; char * name; attr;

20、ExpType type; TreeNode; 说明:在这里当当只是设计的语法树的基本数据结构,至于要用到parse过程中还要进行具体的修改,调试。这些工作都已经在程序原代码调试过程中做好。第四部分:LALR分析。(使用yacc工具)这一部分完成了整个编译过程中的语法分析,二异性冲突处理,lese悬挂问题的处理,运算符优先级处理以及错误报告。参考课本P492 29条cminus BNF。并且通过细心理解体会,写出了cminus.y文件,并能通过yacc生成c代码。Cnimus.y代码以及一些具体功能如下所述:一YACC源程序的结构说明部分的内容如下: 头文件 宏定义 数据类型定义 全局变量定义

21、 语法开始符定义 语义值类型定义 终结符定义 运算符优先级及结合性定义%#define YYPARSER /* distinguishes Yacc output from other code files */#include globals.h#include util.h#include scan.h#include parse.hTreeNode * parseTree; /* stores syntax tree for later return */void yyerror (const char *s);%语法开始符号的定义start 非终结符注:若没有上述说明,YACC自动将第

22、一条语法规则左部的非终结符作为语法开始符。 语义值类型的定义%union定义语义值的类型;%union TreeNode * tnode; TokenType tok; %type定义文法符号的语义值类型; %type program declaration_list declaration var_declaration%type fun_declaration params param_list param compound_stmt %type local_declarations statement_list statement %type expression_stmt select

23、ion_stmt iteration_stmt%type return_stmt expression var simple_expression%type additive_expression term factor call args arg_list%type type_specifier relop addop mulop%token在定义终结符号时也可以定义语义值类型。终结符的定义%token 终结符名 编号%token DIGIT LETTER%token BEGIN 100注: 1.非终结符不需要特别说明,如果需要说明语义值类型则用type语句; 2.文字字符终结符不需要特别说

24、明,它们的编号取其在字符集中的值; 3.在规则中出现文字字符时用单引号括起来。%token ENDFILE,ERROR,%token IF,ELSE,INT,RETURN,VOID,WHILE,%token ID,NUM,%token ASSIGN,%token EQ,NOTEQ,LTEQ,GTEQ,LT,GT,%token PLUS,MINUS,TIMES,OVER,%token LPAREN,RPAREN,LBRACK,RBRACK,LCURL,RCURL,%token SEMI,COMMA运算符优先级和结合性的定义以left和right定义结合性;以排列顺序定义优先级;在语法规则中,以p

25、rec辅助定义优先级消除二义性的两条规则:1.出现移进/归约冲突时,进行移进;2.出现归约/归约冲突时,用先出现的规则进行归约;stat : IF bexp THEN statIF bexp THEN stat ELSE stat ;用结合性和优先级解决冲突;规则的结合性就是规则右部最后一个非终结符的优先级和结合性;如果使用了prec子句,则优先级和结合性由prec子句决定;对于无优先级和结合性的规则,用规则1、2解决;对于有优先级和结合行的规则,用如下的规则解决:出现移进/归约冲突时,输入符号的优先级大于规则的优先级则移进,若输入符号的优先级小于规则的优先级则归约,若二者的优先级相同,左结合

26、则归约,右结合则移进,无结合则出错。二语法规则program : declaration_list parseTree = $1; YYACCEPT; ;declaration_list : declaration_list declaration TreeNode * t = $1; if (t != NULL) while (t-sibling != NULL) t = (TreeNode *) t-sibling; t-sibling = $2; $ = $1; else $ = $2; | declaration $ = $1; ;declaration : var_declarati

27、on $ = $1; | fun_declaration $ = $1; ;程序由声明的列表(或序列)组成,声明可以是函数或变量声明,顺序是任意的。至少必须有一个声明。接下来是语义限制(这些在C中不会出现)。所有的变量和函数在使用前必须声明(这避免了向后backpatching引用)。程序中最后的声明必须是一个函数声明,名字为main。var_declaration : type_specifier ID SEMI $ = (TreeNode *) newNode(VarDeclK); $-attr.op = $1; $-child0 = (TreeNode *) newNode(IdK); $-child0-

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1