1编译原理实验指导.docx
《1编译原理实验指导.docx》由会员分享,可在线阅读,更多相关《1编译原理实验指导.docx(28页珍藏版)》请在冰豆网上搜索。
1编译原理实验指导
编译原理实验指导书
合肥学院计算机科学与技术系
实验一 词法分析程序
一、实验目的
通过设计编制调试一个具体的词法分析程序,加深对词法分析原理的理解。
并掌握在对程序设计语言源程序进行扫描过程中将其分解为各类单词的词法分析方法。
二、实验内容
1.编制一个读单词词法分析程序即扫描器;从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类;其中包括名字、类型、分配的内存空间;
2.并依次输出各个单词的内部编码及单词符号自身值。
(遇到错误时可显示“Error”,然后跳过错误部分继续显示)
3.处理各常量说明,计算每个常量的值和类型。
三、实验预习提示
1、词法分析器的功能和输出格式
词法分析器的功能是输入源程序,输出单词符号。
词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。
本实验中,采用的是一类符号一种别码的方式。
2、单词的BNF表示
<标识符>-> <字母><字母数字串>
<字母数字串>-><字母><字母数字串>|<数字><字母数字串>|
<下划线><字母数字串>|ε
<无符号整数>-> <数字><数字串>
<数字串>-> <数字><数字串> |ε
<加法运算符>-> +
<减法运算符>-> -
<大于关系运算符>-> >
<大于等于关系运算符>-> >=
3、“超前搜索”方法
词法分析时,常常会用到超前搜索方法。
如当前待分析字符串为“a>+”,当前字符为’>’,此时,分析器倒底是将其分析为大于关系运算符还是大于等于关系运算符呢?
显然,只有知道下一个字符是什么才能下结论。
于是分析器读入下一个字符’+’,这时可知应将’>’解释为大于运算符。
但此时,超前读了一个字符’+’,所以要回退一个字符,词法分析器才能正常运行。
在分析标识符,无符号整数等时也有类似情况。
4、模块结构
四、实验步骤
(一)准备:
1.阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、分隔符和程序例。
2.初步编制好程序。
3.准备好多组测试数据。
(二)上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
上机调试通过。
(三)写出(画出)设计方案:
模块关系简图、流程图、全局变量、函数接口等。
(四)程序要求:
程序输入/输出示例:
如源程序为C语言。
输入如下一段:
main()
{
int a,b;
a = 10;
b = a + 20;
}
要求输出如右图。
(2,”main”)
(5,”(“)
(5,”)“)
(5,”{“)
(1,”int”)
(2,”a”)
(5,”,”)
(2,”b”)
(5,”;”)
(2,”a”)
(4,”=”)
(3,”10”)
(5,”;”)
(2,”b”)
(4,”=”)
(2,”a”)
(4,”+”)
(3,”20”)
(5,”;”)
(5,”}“)
要求:
识别保留字:
if、int、for、while、do、return、break、continue;
单词种别码为1。
其他的都识别为标识符;单词种别码为2。
常数为无符号整形数;单词种别码为3。
运算符包括:
+、-、*、/、=、>、<、>=、<=、!
= ;
单词种别码为4。
分隔符包括:
、;、{、}、(、); 单词种别码为5。
以上为参考,具体可自行增删。
实验二 递归子程序方法
一、实验目的
根据某一文法编制调试递归下降分析程序,以便对任意输入的符号串进行分析。
本次实验的目的主要是加深对递归下降分析法的理解。
二、实验内容
1.定义部分:
定义常量、变量、数据结构。
2.初始化:
从文件将输入符号串输入到字符缓冲区中。
3.利用递归下降分析法分析,对每个非终结符编写函数,在主函数中调用文法开始符号的函数。
三、实验预习提示:
1、递归下降分析法的功能
2、词法分析器的功能是利用函数之间的递归调用模拟语法树自上而下的构造过程。
3、递归下降分析法的前提
4、改造文法:
消除二义性、消除左递归、提取左因子,判断是否为LL
(1)文法,
5、递归下降分析法实验设计思想及算法
为G的每个非终结符号U构造一个递归过程,不妨命名为U。
U的产生式的右边指出这个过程的代码结构:
(1)若是终结符号,则和向前看符号对照,
(2)若匹配则向前进一个符号;否则出错。
(3)若是非终结符号,则调用与此非终结符对应的过程。
当A的右部有多个产生式时,可用选择结构实现。
具体为:
(1)对于每个非终结符号U->u1|u2|…|un处理的方法如下:
U( ){ch=当前符号;
if(ch可能是u1字的开头) 处理u1的程序部分;
else if(ch可能是u2字的开头)处理u2的程序部分;
…
else error()
}
(2)对于每个右部u1->x1x2…xn的处理架构如下:
处理x1的程序;
处理x2的程序;
…
处理xn的程序;
(3)如果右部为空,则不处理。
(4)对于右部中的每个符号xi
① 如果xi为终结符号:
if(xi= = 当前的符号)
{
NextChar();
return;
}
else
出错处理
② 如果xi为非终结符号,直接调用相应的过程xi()
说明:
NextChar为前进一个字符函数。
四、实验步骤:
(一)准备:
1.阅读课本有关章节,
2.考虑好设计方案;
3.设计出模块结构、测试数据,初步编制好程序。
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
第二次上机调试通过。
(三)程序要求:
程序输入/输出示例:
对下列文法,用递归下降分析法对任意输入的符号串进行分析:
(1)E->TG
(2)G->+TG|—TG
(3)G->ε
(4)T->FS
(5)S->*FS|/FS
(6)S->ε
(7)F->(E)
(8)F->i
输出的格式如下:
(1)递归下降分析程序,编制人:
姓名,学号,班级
(2)输入一以#结束的符号串(包括+—*/()i#):
在此位置输入符号串例如i+i*i#
(3)输出结果:
i+i*i#为合法符号串
备注:
输入一符号串如i+i*#,要求输出为“非法的符号串”。
引用也要改变。
注意:
1.表达式中允许使用运算符(+-*/)、分割符(括号)、字符I,结束符#;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.对学有余力的同学,可以详细的输出推导的过程,即详细列出每一步使用的产生式。
实验三 LL
(1)分析方法
一、实验目的
根据某一文法编制调试LL
(1)分析程序,以便对任意输入的符号串进行分析。
加深对预测分析LL
(1)分析法的理解。
二、实验内容
1.定义部分:
定义常量、变量、数据结构。
2.初始化:
设立LL
(1)分析表、初始化变量空间(包括堆栈、结构体、数组、临时变量等);
3.控制部分:
从键盘输入一个表达式符号串;
4.利用LL
(1)分析算法进行表达式处理:
根据LL
(1)分析表对表达式符号串进行堆栈(或其他)操作,输出分析结果,如果遇到错误则显示错误信息。
三、实验预习提示
1.LL
(1)分析法的功能LL
(1)分析法的功能是利用LL
(1)控制程序根据显示栈栈顶内容、向前看符号以及LL
(1)分析表,对输入符号串自上而下的分析过程。
2.LL
(1)分析法的前提
改造文法:
消除二义性、消除左递归、提取左因子,判断是否为LL
(1)文法,
3.LL
(1)分析法实验设计思想及算法
四、实验步骤:
(一)准备:
1.阅读课本有关章节,
2.考虑好设计方案;
3.设计出模块结构、测试数据,初步编制好程序。
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
第二次上机调试通过。
(三)程序要求:
程序输入/输出示例:
对下列文法,用LL
(1)分析法对任意输入的符号串进行分析:
(1)E->TG
(2)G->+TG|—TG
(3)G->ε
(4)T->FS
(5)S->*FS|/FS
(6)S->ε
(7)F->(E)
(8)F->i
输出的格式如下:
(1)LL
(1)分析程序,编制人:
姓名,学号,班级
(2)输入一以#结束的符号串(包括+—*/()i#):
在此位置输入符号串
(3)输出过程如下:
步骤 分析栈 剩余输入串 所用产生式
1 E i+i*i# E->TG
(4)输入符号串为非法符号串(或者为合法符号串)
备注:
(1)在“所用产生式”一列中如果对应有推导则写出所用产生式;如果为匹配终结符则写明匹配的终结符;如分析异常出错则写为“分析出错”;若成功结束则写为“分析成功”。
(2) 在此位置输入符号串为用户自行输入的符号串。
(3)上述描述的输出过程只是其中一部分的。
注意:
1.表达式中允许使用运算符(+-*/)、分割符(括号)、字符i,结束符#;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.对学有余力的同学,测试用的表达式事先放在文本文件中,一行存放一个表达式,同时以分号分割。
同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照;
实验四 算符优先文法处理
一、实验目的
掌握算符优先分析法的原理,利用算符优先分析法将赋值语句进行语法分析,翻译成等价的四元式表示。
二、实验内容:
1.算术表达式的文法可以是(你可以根据需要适当改变):
E→E+E|E-E|E*E|E/E|(E)|i
2.根据算符优先分析法,将表达式进行语法分析,判断一个表达式是否正确。
3.将赋值语句进行语法分析,翻译成等价的一组基本操作,每一基本操作用四元式表示。
三、实验预习提示
1.实验原理
我们要分析的表达式满足下面的算符优先矩阵
θ2\θ1 + - * / ( ) ε
+ > > < < < > >
- >> < < < >>
* > > > > < > >
/ > > > > < > >
( < < < < < =
) > > > > > >
ε < < < < < =
为实现算符优先算法,可以使用两个工作栈。
一个叫做OPTR,用以寄存运算符,一个叫OPND,用以寄存操作数或结果。
算法描述如下:
[1]首先置操作数栈为空栈,将表达式起始符;作为运算符栈的栈底元素。
[2]依次读入表达式中每个单词,若是操作数则进OPND栈,若是运算符则转[3]。
[3]将此运算符θ1与OPTR栈顶元素θ2进行比较,即查上表,若 θ1>θ2,则:
θ1进栈,转[2]
若 θ1=θ2 ,如θ1为;,则分析成功,否则OPTR栈顶元素出栈,并转[2]
若 θ1<θ2,则出栈OPND栈顶元素至b,又出栈其栈顶元素至a,出栈OPTR栈顶元素至t,进行运算r=a t b(t 为运算符),并将结果r存入栈OPND后转[3]。
若θ1和θ2之间无优先关系,则报错。
四、实验步骤
(一)准备:
1. 阅读课本有关章节,花一周时间确定算术表达式的文法,设计出算符优先关系表;
2.考虑好设计方案;
3. 设计出模块结构、测试数据,初步编制好程序。
(二)上课上机:
上机调试,发现错误,分析错误,再修改完善。
教师根据学生的设计方案与学生进行探讨,以修改方案和代码。
(三)程序要求:
程序思路(仅供参考):
1.借用实验一的结果,可将其中的取字符函数几乎原封不动地移植过来,其中的分割和分析单词的方法可借用过来分割现在这个实验的运算符、常量和变量。
2.模块结构:
(1)初始化:
设立算符优先关系表(或优先函数)、初始化变量空间(包括堆栈、结构体、数组、临时变量等);
(2)控制部分:
将一个表达式从文件中读出;(3)词法分析:
将表达式分割成单词序列;(4)利用算符优先文法进行表达式处理:
根据算符优先关系表(或优先函数)对表达式单词序列进行堆栈(或其他)操作,得到并保存四元组,如果遇到错误则显示错误信息;(5)输出四元组。
3.程序输入/输出示例:
如参考C语言的运算符。
输入如下表达式(以分号为结束)和输出结果:
(1)10;
输出:
正确
(2)1+2;
输出:
正确
(3)(1+2)/3+4-(5+6/7);
输出:
正确
(4)((1-2)/3+4
输出:
错误
(5)1+2-3+(*4/5)
输出:
错误
注意:
1.为降低难度,表达式中不含变量(只含无符号整数);
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.测试用的表达式事先放在文本文件中,一行存放一个表达式,同时以分号分割。
同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照;
4.对学有余力的同学,可增加功能:
当判断一个表达式正确时,输出计算结果,计算过程用浮点表示,但要注意不要被0除。
实验五 LR(K)分析方法
一、实验目的
构造LR
(1)分析程序,利用它进行语法分析,判断给出的符号串是否为该文法识别的句子,了解LR(K)分析方法是严格的从左向右扫描,和自底向上的语法分析方法。
二、实验内容
1.定义部分:
定义常量、变量、数据结构。
2.初始化:
设立LR
(1)分析表、初始化变量空间(包括堆栈、结构体、数组、临时变量等);
3.控制部分:
从键盘输入一个表达式符号串;
4.利用LR
(1)分析算法进行表达式处理:
根据LR
(1)分析表对表达式符号串进行堆栈(或其他)操作,输出分析结果,如果遇到错误则显示错误信息。
三、实验预习提示
1、使用LR
(1)的优点:
(1)LR分析器能够构造来识别所有能用上下文无关文法写的程序设计语言的结构。
(2)LR分析方法是已知的最一般的无回溯移进-归约方法,它能够和其他移进-归约方法一样有效地实现。
(3)LR方法能分析的文法类是预测分析法能分析的文法类的真超集。
(4)LR分析器能及时察觉语法错误,快到自左向右扫描输入的最大可能。
为了使一个文法是LR的,只要保证当句柄出现在栈顶时,自左向右扫描的移进-归约分析器能够及时识别它便足够了。
当句柄出现在栈顶时,LR分析器必须要扫描整个栈就可以知道这一点,栈顶的状态符号包含了所需要的一切信息。
如果仅知道栈内的文法符号就能确定栈顶是什么句柄。
LR分析表的转移函数本质上就是这样的有限自动机。
不过,这个有限自动机不需要根据每步动作读栈,因为,如果这个识别句柄的有限自动机自底向上读栈中的文法符号的话,它达到的状态正是这时栈顶的状态符号所表示的状态,所以,LR分析器可以从栈顶的状态确定它需要从栈中了解的一切。
2、LR分析器由三个部分组成:
(1)总控程序,也可以称为驱动程序。
对所有的LR分析器总控程序都是相同的。
(2)分析表或分析函数,不同的文法分析表将不同,同一个文法采用的LR分析器不同时,分析表将不同,分析表又可以分为动作表(ACTION)和状态转换(GOTO)表两个部分,它们都可用二维数组表示。
(3)分析栈,包括文法符号栈和相应的状态栈,它们均是先进后出栈。
分析器的动作就是由栈顶状态和当前输入符号所决定。
LR分析器结构:
sp
其中:
SP为栈指针,S[i]为状态栈,X[i]为文法符号栈。
状态转换表用GOTO[i,X]=j表示,规定当栈顶状态为i,遇到当前文法符号为X时应转向状态j,X为终结符或非终结符。
ACTION[i,a]规定了栈顶状态为i时遇到输入符号a应执行。
动作有四种可能:
(1)移进:
action[i,a]= Sj:
状态j移入到状态栈,把a移入到文法符号栈,其中i,j表示状态号。
(2)归约:
action[i,a]=rk:
当在栈顶形成句柄时,则归约为相应的非终结符A,即文法中有A->B的产生式,若B的长度为R(即|B|=R),则从状态栈和文法符号栈中自顶向下去掉R个符号,即栈指针SP减去R,并把A移入文法符号栈内,j=GOTO[i,A]移进状态栈,其中i为修改指针后的栈顶状态。
(3)接受acc:
当归约到文法符号栈中只剩文法的开始符号S时,并且输入符号串已结束即当前输入符是'#',则为分析成功。
(4)报错:
当遇到状态栈顶为某一状态下出现不该遇到的文法符号时,则报错,说明输入端不是该文法能接受的符号串。
3、LL
(1)分析法实验设计思想及算法
四、实验步骤
(一)准备:
1.阅读课本有关章节,
2.考虑好设计方案;
3.设计出模块结构、测试数据,初步编制好程序。
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
(三)程序要求:
程序输入/输出示例:
对下列文法,用LR
(1)分析法对任意输入的符号串进行分析:
(1)E->E+T
(2)E->E—T
(3)T->T*F
(4)T->T/F
(5)F->(E)
(6)F->i
输出的格式如下:
(1)LR
(1)分析程序,编制人:
姓名,学号,班级
(2)输入一以#结束的符号串(包括+—*/()i#):
在此位置输入符号串
(3)输出过程如下:
步骤 状态栈 符号栈 剩余输入串 动作
1 0 # i+i*i# 移进
(4)输入符号串为非法符号串(或者为合法符号串)
备注:
(1)在“所用产生式”一列中如果对应有推导则写出所用产生式;如果为匹配终结符则写明匹配的终结符;如分析异常出错则写为“分析出错”;若成功结束则写为“分析成功”。
(2) 在此位置输入符号串为用户自行输入的符号串。
注意:
1.表达式中允许使用运算符(+-*/)、分割符(括号)、字符i,结束符#;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.对学有余力的同学,测试用的表达式事先放在文本文件中,一行存放一个表达式,同时以分号分割。
同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照;
实验六 逆波兰式的产生及计算
一、实验目的
将非后缀式用来表示的算术表达式转换为用逆波兰式来表示的算术表达式,并计算用逆波兰式来表示的算术表达式的值。
二、实验内容
1.定义部分:
定义常量、变量、数据结构。
2.初始化:
设立算符优先分析表、初始化变量空间(包括堆栈、结构体、数组、临时变量等);
3.控制部分:
从键盘输入一个表达式符号串;
4.利用算符优先分析算法进行表达式处理:
根据算符优先分析表对表达式符号串进行堆栈(或其他)操作,输出分析结果,如果遇到错误则显示错误信息。
5.对生成的逆波兰式进行计算。
三、实验预习提示
1、逆波兰式定义
将运算对象写在前面,而把运算符号写在后面。
用这种表示法表示的表达式也称做后缀式。
逆波兰式的特点在于运算对象顺序不变,运算符号位置反映运算顺序。
采用逆波兰式可以很好的表示简单算术表达式,其优点在于易于计算机处理表达式。
2、产生逆波兰式的前提
中缀算术表达式
3、逆波兰式生成的实验设计思想及算法
(1)首先构造一个运算符栈,此运算符在栈内遵循越往栈顶优先级越高的原则。
(2)读入一个用中缀表示的简单算术表达式,为方便起见,设该简单算术表达式的右端多加上了优先级最低的特殊符号“#”。
(3)从左至右扫描该算术表达式,从第一个字符开始判断,如果该字符是数字,则分析到该数字串的结束并将该数字串直接输出。
(4)如果不是数字,该字符则是运算符,此时需比较优先关系。
做法如下:
将该字符与运算符栈顶的运算符的优先关系相比较。
如果,该字符优先关系高于此运算符栈顶的运算符,则将该运算符入栈。
倘若不是的话,则将此运算符栈顶的运算符从栈中弹出,将该字符入栈。
(5)重复上述操作
(1)-
(2)直至扫描完整个简单算术表达式,确定所有字符都得到正确处理,我们便可以将中缀式表示的简单算术表达式转化为逆波兰表示的简单算术表达式。
3、逆波兰式计算的实验设计思想及算法
(1)构造一个栈,存放运算对象。
(2)读入一个用逆波兰式表示的简单算术表达式。
(3)自左至右扫描该简单算术表达式并判断该字符,如果该字符是运算对象,则将该字符入栈。
若是运算符,如果此运算符是二目运算符,则将对栈顶部的两个运算对象进行该运算,将运算结果入栈,并且将执行该运算的两个运算对象从栈顶弹出。
如果该字符是一目运算符,则对栈顶部的元素实施该运算,将该栈顶部的元素弹出,将运算结果入栈。
(4)重复上述操作直至扫描完整个简单算术表达式的逆波兰式,确定所有字符都得到正确处理,我们便可以求出该简单算术表达式的值。
四、实验步骤
(一)准备:
1.阅读课本有关章节,
2.考虑好设计方案;
3.设计出模块结构、测试数据,初步编制好程序。
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
第二次上机调试通过。
(三)程序要求:
程序输入/输出示例:
输出的格式如下:
(1)逆波兰式的生成及计算程序,编制人:
姓名,学号,班级
(2)输入一以#结束的中缀表达式(包括+—*/()数字#):
在此位置输入符号串如(28+68)*2#
(3)逆波兰式为:
28&68+2*
(4)逆波兰式28&68+2*计算结果为192
备注:
(1)在生成的逆波兰式中如果两个数相连则用&分隔,如28和68,中间用&分隔;
(2)在此位置输入符号串为用户自行输入的符号串。
注意:
1.表达式中允许使用运算符(+-*/)、分割符(括号)、数字,结束符#;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.对学有余力的同学,测试用的表达式事先放在文本文件中,一行存放一个表达式,同时以分号分割。
同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照
实验七 课程设计
一、实验目的
综合运用各章的知识,完成小型编译系统,初步掌握编译系统开发的基本方法;提高学生的应用程序设计能力,提高分析问题、解决问题的能力。
二、实验内容
1.利用需求分析、设计说明写出程序结构框架,阐明设计思路、用到的原理和方法。
2.程序规模适中,着重于内核功能,对界面无要求。
3.充分利用实验一、二、三模块和结论。
4.课程实验具有词法分析、语法分析、语义分析,目标代码生成等基本功能。
三、实验步骤
(一)选题:
通过平时积累,找到适合于自己的应用或某种软件功能,该应用能利用编译原理中的某些理论。
题目大小适中。
请在一周前选好题目。
参考题目如下:
1.表达式计算器:
这是一款算术表达式计算程序,可直接利用实验四的成果,用户通过输入表达式达到计算的目的,可代替目前普遍使用的计算器。
设计难度一般。
2.字符串搜索程序:
用户输入要查找的字符串的正则表达式,软件可在大量文本中找到符合描述的字符串。
这个设计可参考微软.N