编译原理实验指导.docx
《编译原理实验指导.docx》由会员分享,可在线阅读,更多相关《编译原理实验指导.docx(26页珍藏版)》请在冰豆网上搜索。
编译原理实验指导
.
编译原理
实验指导书
主编:
徐静李娜
.
编译原理实验指导书
信息与电气工程学院
2010年3月
概述
一、本课程实验的目的和任务
编译原理是一门实践性很强的课程,只有通过实践,才能真正掌握。
实际的编译程序是十分复杂的,有时由多达十几万条指令组成。
为此,编译原理的实践教学,采用简化编译过程的办法,选择最关键的3个环节──词法分析、语法分析(包括语义处理、产生无优化的目标指令)、连接调试,进行编程和调试训练。
每个环节作为一个实践课题。
先分别编程调试,再连接在一起总调。
二、实验方法
任何一个实用的高级语言,其语法都比较复杂,如选其作为源语言,很难实践全过程。
故本实验将定义一个简化的语言──C语言的一个子集作为源语言,设计调试出它的编译程序。
前后贯穿这一条主线进行实践。
每次都可利用课余时间编程,利用上机时间进行输入和调试。
三、实验报告的规范和要求
每个实验完成后写出实验报告。
实验报告的内容包括如下内容:
一、实验目的
二、程序设计时采用的算法和方法
三、输入的源程序
1
编译原理实验指导书
四、词法分析程序清单和输出结果。
五、心得体会
实验一词法分析
一、实验目的:
(1)通过设计编制调试一个具体的词法分析程序,理解词法分析在编译程序中的作用。
(2)加深对有穷自动机模型的理解。
(3)掌握词法分析程序的实现方法和技术。
(4)用C语言对一个简单语言的子集编制一个一遍扫描的程序,以加深对编译原理的理解,掌握编译程序的实现方法和技术。
编制一个读单词过程,从输入的源程序中,识别出各个具有独立意义的单词,即基本保留字、标识符、常数、运算符、分隔符五大类。
并依次输出各个单词的内部编码及单词符号自身值。
(遇到错误时可显示“Error”,然后跳过错误部分继续显示)。
二、实验预习提示
1.词法分析器的功能和输出格式
词法分析器的功能是输入源程序,输出单词符号。
词法分析器的单词符号常常表示成以下的二元式(单词种别码,单词符号的属性值)。
本实验中,采用的是一类符号一种别码的方式。
2
编译原理实验指导书
2.单词的BNF表示
<标识符>→<字母><字母数字串>
<字母数字串>→<字母><字母数字串>|<数字><字母数字串>|
<下划线><字母数字串>|ε
<无符号整数>→<数字><数字串>
<数字串>→<数字><数字串>|ε
<加法运算符>→+
<减法运算符>→-
<大于关系运算符>→>
<大于等于关系运算符>→>=
3.“超前搜索”方法
词法分析时,常常会用到超前搜索方法。
如当前待分析字符串为“a>+”,当前字符为“>”,此时,分析器到底是将其分析为大于关系运算符还是大于等于关系运算符呢?
显然,只有知道下一个字符是什么才能下结论。
于是分析器读入下一个字符“+”,这时可知应将“>”解释为大于运算符。
但此时,超前读了一个字符“+”,所以要回退一个字符,词法分析器才能正常运行。
在分析标识符,无符号整数等时也有类似情况。
4.模块结构
3
编译原理实验指导书
main()主函数输入文件名判断能否打开文件Y
N
缓冲区扫描一个字符调用Y
缓冲区中是取单词扫描一个字符否还有字符返回N
输出结束
三、实验过程和指导:
(一)准备:
阅读课本有关章节,明确语言的语法,写出基本保留字、标识符、常数、运算符、1.分隔符和程序例。
初步编制好程序。
2.3.准备多组测试数据。
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
第二次上机调试通过。
(三)程序要求:
输出示例:
程序输入/4
编译原理实验指导书
如源程序为C语言。
输入如下一段:
main()
{
inta,b;
a=10;
b=a+20;
}
要求输出如下图。
(2,”main”)(4,”=”)
(3,”10”)(5,”(“)
(5,”;”),”)“)(5
(2,”b”),”{“)(5(14,”=”),”int”),”a”,”a”
,”,”,”+”,”20”,”b”,”;”,”;”
,”}“,”a”(要求:
;单词种别while、、int、识别保留字:
1.ifforcontinue、、return、do、break1码为。
5
编译原理实验指导书
2.其他的都识别为标识符;单词种别码为2。
3.常数为无符号整型数;单词种别码为3。
4.运算符包括:
+、-、*、/、=、、<、=、<=、!
=;单词种别码为4。
5.分隔符包括:
、;、{、}、(、);单词种别码为5。
以上为参考,具体可自行增删。
(四)程序思路(仅供参考):
这里以开始定义的C语言子集的源程序作为词法分析程序的输入数据。
在词法分析中,自文件头开始扫描源程序字符,一旦发现符合“单词”定义的源程序字符串时,将它翻译成固定长度的单词内部表示,并查填适当的信息表。
经过词法分析后,源程序字符串(源程序的外部表示)被翻译成具有等长信息的单词串(源程序的内部表示),并产生两个表格:
常数表和标识符表,它们分别包含了源程序中的所有常数和所有标识符。
0.定义部分:
定义常量、变量、数据结构。
1.初始化:
从文件将源程序全部输入到字符缓冲区中。
2.取单词前:
去掉多余空白。
3.取单词后:
去掉多余空白。
4.取单词:
读出单词的每一个字符,组成单词,分析类型。
(关键是如何判断取单词结束?
取到的单词是什么类型的单词?
)
5.显示结果。
(五)练习该实验的目的和思路:
程序开始变得复杂起来,可能是大家目前编过的程序中最复杂的,但相对于以后的程序来说还是简单的。
因此要认真把握这个过渡期的练习。
6
编译原理实验指导书
本实验和以后的实验相关。
通过练习,掌握对字符进行灵活处理的方法。
(六)为了能设计好程序,注意以下事情:
1.模块设计:
将程序分成合理的多个模块(函数),每个模块做具体的同一事情。
2.写出(画出)设计方案:
模块关系简图、流程图、全局变量、函数接口等。
3.编程时注意编程风格:
空行的使用、注释的使用、缩进的使用等。
(七)程序框架:
#include
#include
charprogram[80],token[8];/*数组program存放的为源程序所有字符,数组token为存放的单词自身字符串*/
charch;
intsyn,p,m,n,row;/*syn为单词种别码*/
longintnum;/*sum为整型常数*/
7
编译原理实验指导书
char*key
[8]={if,int,
or,while,do,
eturn,reak,continue};/*保留字*/
voidmain()
{
p=0;
row=1;
printf(\
pleaseinputstring:
\n);
do/*从文件将源程序全部输入到字符缓冲区中*/
{
ch=getchar();
program[p++]=ch;
}
while(ch!
='#');
p=0;
do
{
scaner();
switch(syn)
{
8
编译原理实验指导书
case3:
printf(\
(%d,%d),syn,num);break;
case-1:
printf(\
FOUNDERRORINROW%d,row);break;
case-2:
row=row++;break;
default:
printf(\
(%d,%s),syn,token);break;
}
}
while(syn!
=0);
getch();
}
scaner()
{
for(n=0;n<8;n++)
token[n]=NULL;
m=0;
ch=program[p++];
while(ch=='')
{
ch=program[p++];
}
9
编译原理实验指导书
/*分类判断
。
1.识别标识符(包括保留字),建议:
关键字作为特殊标识符处理,把它们预先安排在一张表格中(保留字表)当扫描程序识别标识符时,查关键字,否则为一般标识符。
;单词种别码、continue、return、break、if、intfor、while、do注意:
识别保留字:
2。
为1。
其他的都识别为标识符;单词种别码为
识别常数。
2.的值,与主函数的代码呼应。
注意:
常数的有效范围,如果产生溢出则设置synase3:
printf(\
(%d,%d),syn,num);break;
ccase-1:
printf(\
FOUNDERRORINROW%d,row);break;
。
常数为无符号整型数;单词种别码为3
3.识别运算符。
switch语句)(。
注意:
区分两个运算符<和<=
-、*、/、=、、<、=、<=运算符包括:
+、、!
=单词种别码为4。
4.识别界符。
分隔符包括:
、;、{、}、(、)单词种别码为5。
(switch语句)
*/
}
10
编译原理实验指导书
实验二递归下降分析法
一、实验目的:
根据某一文法编制调试递归下降分析程序,以便对任意输入的符号串进行分析。
本次实验的目的主要是加深对递归下降分析法的理解。
二、实验预习提示
1.递归下降分析法的功能
词法分析器的功能是利用函数之间的递归调用模拟语法树自上而下的构造过程。
2.递归下降分析法的前提
改造文法:
消除二义性、消除左递归、提取左因子,判断是否为LL
(1)文法。
3.递归下降分析法实验设计思想及算法
为G的每个非终结符号U构造一个递归过程,不妨命名为U。
U的产生式的右边指出这个过程的代码结构:
(1)若是终结符号,则和向前看符号对照,若匹配则向前进一个符号;否则出错。
(2)若是非终结符号,则调用与此非终结符对应的过程。
当A的右部有多个产生式时,可用选择结构实现。
具体为:
①对于每个非终结符号U→u1|u2|…|un处理的方法如下:
U()
{
ch=当前符号;u1的程序部分;)if(ch可能是u1字的开头处理)处理u2的程序部分;字的开头可能是elseif(chu2…elseerror();}
11
编译原理实验指导书
②对于每个右部u→xx…x的处理架构如下:
n12处理x的程序;1处理x的程序;2…
处理x的程序;n③如果右部为空,则不处理。
④对于右部中的每个符号x。
iA.如果xi为终结符号:
if(xi==当前的符号)
{
NextChar();
Return;
}
else
出错处理
B.如果xi为非终结符号,直接调用相应的过程xi()。
说明:
NextChar为前进一个字符函数。
三、实验过程和指导:
(一)准备:
1.阅读课本有关章节,
2.考虑好设计方案;
3.设计出模块结构、测试数据,初步编制好程序。
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
第二次上机调试通过。
(三)程序要求:
程序输入/输出示例:
对下列文法,用递归下降分析法对任意输入的符号串进行分析:
(1)E→TG
12
编译原理实验指导书
(2)G→+TG|—TG
(3)G→ε
(4)T→FS
(5)S→*FS|/FS
(6)S→ε
(7)F→(E)
(8)F→i
输出的格式如下:
递归下降分析程序,编制人:
姓名,学号,班级
(1)
:
在此位置输入符号串例如:
i+i*i#()+—*/i#)输入一以
(2)#结束的符号串(包括
输出结果:
i+i*i#为合法符号串(3)
备注:
输入一符号串如i+i*#,要求输出为“非法的符号串”。
注意:
1.表达式中允许使用运算符(+-*/)、分割符(括号)、字符I,结束符#;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.对学有余力的同学,可以详细的输出推导的过程,即详细列出每一步使用的产生式。
(四)程序思路(仅供参考):
0.定义部分:
定义常量、变量、数据结构。
1.初始化:
从文件将输入符号串输入到字符缓冲区中。
2.利用递归下降分析法分析,对每个非终结符编写函数,在主函数中调用文法开始符号的函数。
(五)练习该实验的目的和思路:
程序开始变得复杂起来,需要利用到程序设计语言的知识和大量编程技巧,递归下降分析法是一种较实用的分析法,通过这个练习可大大提高软件开发能力。
通过练习,掌握函数间相互调用的方法。
(六)为了能设计好程序,注意以下事情:
1.模块设计:
将程序分成合理的多个模块(函数),每个模块做具体的同一事情。
2.写出(画出)设计方案:
模块关系简图、流程图、全局变量、函数接口等。
13
编译原理实验指导书
3.编程时注意编程风格:
空行的使用、注释的使用、缩进的使用等。
实验三LL
(1)分析法
一、实验目的:
根据某一文法编制调试LL
(1)分析程序,以便对任意输入的符号串进行分析。
本次实验的目的主要是加深对预测分析LL
(1)分析法的理解。
二、实验预习提示
1、LL
(1)分析法的功能
LL
(1)分析法的功能是利用LL
(1)控制程序根据显示栈栈顶内容、向前看符号以及LL
(1)分析表,对输入符号串自上而下的分析过程。
2、LL
(1)分析法的前提
改造文法:
消除二义性、消除左递归、提取左因子,判断是否为LL
(1)文法,
3、LL
(1)分析法实验设计思想及算法
三、实验过程和指导:
(一)准备:
1.阅读课本有关章节。
2.考虑好设计方案。
3.设计出模块结构、测试数据,初步编制好程序。
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
第二次上机调试通过。
(三)程序要求:
程序输入/输出示例:
对下列文法,用LL
(1)分析法对任意输入的符号串进行分析:
14
编译原理实验指导书
(1)E→TG
(2)G→+TG|—TG
(3)G→ε
(4)T→FS
(5)S→*FS|/FS
(6)S→ε
(7)F→(E)
(8)F→i
输出的格式如下:
)分析程序,编制人:
姓名,学号,班级
(1)LL(1
:
在此位置输入符号串()i#)(包括+—*/
(2)输入一以#结束的符号串(3)输出过程如下:
步骤分析栈剩余输入串所用产生式
1
TG
E→i+i*i#E
输入符号串为非法符号串(或者为合法符号串)。
(4)
备注:
一列中如果对应有推导则写出所用产生式;如果为匹配终结所用产生式”
(1)在“符则写明匹配的终结符;如分析异常出错则写为“分析出错”;若成功结束则写为“分析成功”。
(2)在此位置输入符号串为用户自行输入的符号串。
上述描述的输出过程只是其中一部分的。
(3)
#+-*/注意:
1.表达式中允许使用运算符()、分割符(括号)、字符i,结束符;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);一行存放一个表达式,对学有余力的同学,测试用的表达式事先放在文本文件中,3.
同时以分号分割。
同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照;(四)程序思路(仅供参考):
15
编译原理实验指导书
模块结构:
1)定义部分:
定义常量、变量、数据结构。
(分析表、初始化变量空间(包括堆栈、结构体、数组、临LL
(1))初始化:
设立(2时变量等);)控制部分:
从键盘输入一个表达式符号串;(3分析表对表达式符号串进行LL
(1)LL
(1)分析算法进行表达式处理:
根据(4)利用堆栈(或其他)操作,输出分析结果,如果遇到错误则显示错误信息。
(五)练习该实验的目的和思路:
程序相当复杂,需要利用到大量的编译原理,也用到了大量编程技巧和数据结构,通过这个练习可大大提高软件开发能力。
(六)为了能设计好程序,注意以下事情:
模块设计:
将程序分成合理的多个模块(函数),每个模块做具体的同一事情。
1.写出(画出)设计方案:
模块关系简图、流程图、全局变量、函数接口等。
2.编程时注意编程风格:
空行的使用、注释的使用、缩进的使用等。
3.
16
编译原理实验指导书
实验四逆波兰式的产生与计算
一、实验目的:
将非后缀式用来表示的算术表达式转换为用逆波兰式来表示的算术表达式,并计算用逆波兰式来表示的算术表达式的值。
二、实验预习提示
1.逆波兰式定义
将运算对象写在前面,而把运算符号写在后面。
用这种表示法表示的表达式也称做后缀式。
逆波兰式的特点在于运算对象顺序不变,运算符号位置反映运算顺序。
采用逆波兰式可以很好的表示简单算术表达式,其优点在于易于计算机处理表达式。
2.产生逆波兰式的前提中缀算术表达式
3.逆波兰式生成的实验设计思想及算法
17
编译原理实验指导书
入栈输入一个中缀式表示的简单运算表达式'#'当前输入符号sym=是对数字进行处理,sym是数字吗?
形成一个数字串否是栈顶运算符优先将向前看符号入栈级低于sym吗?
栈顶运算符出栈否是是且''(顶栈是sym栈顶运算符与'吗?
)sym为'优先级相等吗?
否否程序结束是栈顶运算符优先吗?
sym级高于将栈顶运算符否弹出,且输出处理
首先构造一个运算符栈,此运算符在栈内遵循越往栈顶优先级越高的原则。
(1)
设该简单算术表达式的右为方便起见,
(2)读入一个用中缀表示的简单算术表达式,端多加上了优先级最低的特殊符号“#”。
从左至右扫描该算术表达式,从第一个字符开始判断,如果该字符是数字,则(3)
分析到该数字串的结束并将该数字串直接输出。
如果不是数字,该字符则是运算符,此时需比较优先关系。
(4)
做法如下:
将该字符与运算符栈顶的运算符的优先关系相比较。
如果,该字符优先关系高于此运算符栈顶的运算符,则将该运算符入栈。
倘若不是的话,则将此运算符栈顶的运算符从栈中弹出,将该字符入栈。
确定所有字符都得到正直至扫描完整个简单算术表达式,重复上述操作(5)
(1)-
(2)确处理,我们便可以将中缀式表示的简单算术表达式转化为逆波兰表示的简单算术表达式。
.逆波兰式计算的实验设计思想及算法418
编译原理实验指导书
读入一个逆波兰算术表达式当前输入符号Sym=将该字符入栈否否是运算符吗?
SymSym='#'是是程序结束根据运算符的特点从栈顶部取出若干个运算符对象进行该运算将运算结果入栈
(1)构造一个栈,存放运算对象。
(2)读入一个用逆波兰式表示的简单算术表达式。
自左至右扫描该简单算术表达式并判断该字符,如果该字符是运算对象,则将(3)
该字符入栈。
若是运算符,如果此运算符是二目运算符,则将对栈顶部的两个运算并且将执行该运算的两个运算对象从栈顶弹出。
将运算结果入栈,对象进行该运算,将该栈顶部的元素弹出,则对栈顶部的元素实施该运算,如果该字符是一目运算符,将运算结果入栈。
重复上述操作直至扫描完整个简单算术表达式的逆波兰式,确定所有字符都得(4)
到正确处理,我们便可以求出该简单算术表达式的值。
三、实验过程和指导:
(一)准备:
1.阅读课本有关章节。
考虑好设计方案。
2.设计出模块结构、测试数据,初步编制好程序。
3.
(二)上课上机:
将源代码拷贝到机上调试,发现错误,再修改完善。
第二次上机调试通过。
(三)程序要求:
输出示例:
程序输入/输出的格式如下:
(1)逆波兰式的生成及计算程序,编制人:
姓名,学号,班级19
编译原理实验指导书
:
在此位置输入符号串如()数字#)+—*/
(2)输入一以#结束的中缀表达式(包括
(28+68)*2#
逆波兰式为:
28&68+2*
(3)
192逆波兰式计算结果为28&68+2*(4)
备注:
(1)在生成的逆波兰式中如果两个数相连则用&分隔,如28和68,中间用&分隔;
(2)在此位置输入符号串为用户自行输入的符号串。
注意:
1.表达式中允许使用运算符(+-*/)、分割符(括号)、数字,结束符#;
2.如果遇到错误的表达式,应输出错误提示信息(该信息越详细越好);
3.对学有余力的同学,测试用的表达式事先放在文本文件中,一行存放一个表达式,同时以分号分割。
同时将预期的输出结果写在另一个文本文件中,以便和输出进行对照;
(四)程序思路(仅供参考):
模块结构:
(1)定义部分:
定义常量、变量、数据结构。
(2)初始化:
设立算符优先分析表、初始化变量空间(包括堆栈、结构体、数组、临时变量等);
(3)控制部分:
从键盘输入一个表达式符号串;
(4)利用算符优先分析算法进行表达式处理:
根据算符优先分析表对表达式符号串进行堆栈(或其他)操作,输出分析结果,如果遇到错误则显示错误信息。
(5)对生成的逆波兰式进行计算。
(五)练习该实验的目的和思路:
程序较复杂,需要利用到程序设计语言的知识和大量编程技巧,逆波兰式的生成是算符优先分析法的应用,是一种较实用的分析法,通过这个练习可大大提高软件开发能力。
(六)为了能设计好程序,注意以下事情:
1.模块设计:
将程序分成合理的多个模块(函数),每个模块做具体的同一事情。
2.写出(画出)设计方案:
模块关系简图、流程图、全局变量、函数接口等。
20
编译原理实验指导书
3.编程时注意编程风格:
空行的使用、注释的使用、缩进的使用等。
实验五LR
(1)分析法
一、实验目的:
构造LR
(1)分析程序,利用它进行语法分析,判断给出的符号串是否为该文法
识别的句子,了解LR(K)分析方法是严格的从左向右扫描,和自底向上的语法分析方法。
二、实验预习提示:
1.使用LR
(1)的