词法分析器的设计与实现编译原理实验报告.docx
《词法分析器的设计与实现编译原理实验报告.docx》由会员分享,可在线阅读,更多相关《词法分析器的设计与实现编译原理实验报告.docx(13页珍藏版)》请在冰豆网上搜索。
词法分析器的设计与实现编译原理实验报告
中北大学软件学院
实验报告
专业软件工程
课程名称编译原理
学号
姓名
辅导教师张静成绩
实验日期
2015.5.19
实验时间
14:
00~16:
00
1实验名称:
词法分析器的设计与实现
2、实验目的
(1)掌握C语言单词符号的划分、正规式、状态转换图及词法分析器的实现。
(2)掌握词法分析程序的作用。
3、实验要求
(1)对任给的一个C语言源程序,能够滤掉空格、回车换行符、tab键及注释。
(2)识别各类单词符号,如关键字、标识符、运算符、常数、界符,结果以二元式形式输出,并构造符号表。
(3)输出有词法错误的单词及所在行号。
(在此阶段只能识别有限的词法错误)
4、实验原理
根据扫描到的单词符号的第一个字符的种类,分别转到相应的程序进行处理。
这些程序的功能就是识别以相应字符开头的各类单词符号。
5、实验步骤
(1)根据C语言各类单词的正规式,构造能识别各类单词的状态转换图。
(2)根据状态转换图,构造识别各类单词的词法分析器。
6、状态转换图及词法分析程序
//词法分析程序.cpp
#include
#include
#include
#include
//定义关键字
char*Key[10]={"main","void","int","char","printf","scanf","else","if","return"};
charWord[20],ch;//存储识别出的单词流
intIsAlpha(charc){//判断是否为字母
if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A')))return1;
elsereturn0;
}
intIsNum(charc){//判断是否为数字
if(c>='0'&&c<='9')return1;
elsereturn0;
}
intIsKey(char*Word){//识别关键字函数
intm,i;
for(i=0;i<9;i++){
if((m=strcmp(Word,Key[i]))==0)
{
if(i==0)
return2;
return1;
}
}
return0;
}
voidscanner(FILE*fp){//扫描函数
charWord[20]={'\0'};
charch;
inti,c;
ch=fgetc(fp);//获取字符,指针fp并自动指向下一个字符
if(IsAlpha(ch)){//判断该字符是否是字母
Word[0]=ch;
ch=fgetc(fp);
i=1;
while(IsNum(ch)||IsAlpha(ch)){//判断该字符是否是字母或数字
Word[i]=ch;
i++;
ch=fgetc(fp);
}
Word[i]='\0';//'\0'代表字符结束(空格)
fseek(fp,-1,1);//回退一个字符
c=IsKey(Word);//判断是否是关键字
if(c==0)printf("%s\t$普通标识符\n\n",Word);//不是关键字
elseif(c==2)printf("%s\t$主函数\n\n",Word);
elseprintf("%s\t$关键字\n\n",Word);//输出关键字
}
else//开始判断的字符不是字母
if(IsNum(ch)){//判断是否是数字
Word[0]=ch;
ch=fgetc(fp);
i=1;
while(IsNum(ch)){
Word[i]=ch;
i++;
ch=fgetc(fp);
}
Word[i]='\0';
fseek(fp,-1,1);//回退
printf("%s\t$无符号实数\n\n",Word);
}
else//开始判断的字符不是字母也不是数字
{
Word[0]=ch;
switch(ch){
case'[':
case']':
case'(':
case')':
case'{':
case'}':
case',':
case'"':
case';':
printf("%s\t$界符\n\n",Word);break;
case'+':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){
printf("%s\t$运算符\n\n",Word);//运算符"+="
}
elseif(ch=='+'){
printf("%s\t$运算符\n\n",Word);//判断结果为"++"
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);//判断结果为"+"
}
break;
case'-':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){
printf("%s\t$运算符\n\n",Word);}
elseif(ch=='-'){
printf("%s\t$运算符\n\n",Word);//判断结果为"--"
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);//判断结果为"-"
}
break;
case'*':
case'/':
case'!
':
case'=':
ch=fgetc(fp);
if(ch=='='){
printf("%s\t$运算符\n\n",Word);
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);
}
break;
case'<':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){
printf("%s\t$运算符\n\n",Word);//判断结果为运算符"<="
}
elseif(ch=='<'){
printf("%s\t$运算符\n\n",Word);//判断结果为"<<"
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);//判断结果为"<"
}
break;
case'>':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='=')printf("%s\t$运算符\n\n",Word);
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);
}
break;
case'%':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){printf("%s\t$运算符\n\n",Word);}
if(IsAlpha(ch))printf("%s\t$类型标识符\n\n",Word);
else{
fseek(fp,-1,1);
printf("%s\t$取余运算符\n\n",Word);
}
break;
default:
printf("无法识别字符!
\n\n");break;
}
}
}
main()
{
charin_fn[30];//文件路径
FILE*fp;
printf("\n请输入源文件路径及后缀名(源文件需以‘$’结尾):
");
while
(1){
gets(in_fn);
//scanf("%s",in_fn);
if((fp=fopen(in_fn,"r"))!
=NULL)break;//读取文件内容,并返回文件指针,该指针指向文件的第一个字符
elseprintf("文件路径错误!
请重新输入:
");
}
printf("\n词法分析结果如下:
\n");
do{
ch=fgetc(fp);
if(ch=='$')break;//文件以#结尾,作为扫描结束条件
elseif(ch==''||ch=='\t'||ch=='\n'){}//忽略空格,空白,和换行
else{
fseek(fp,-1,1);//回退一个字节开始识别单词流
scanner(fp);
}
}while(ch!
='$');
system("pause");
return(0);
}
//test.cpp测试程序路径:
D:
\test.cpp
main()
{
intscore;
chargrade;
printf("pleaseinputascore\n");
scanf("%d",amp;score);
grade=score>=90?
'A':
(scoregt;=60?
'B':
'C');
printf("%dbelongsto%c",score,grade);
}
$
7、测试及结果
1、登陆界面:
2、出错异常处理:
3、结果分析:
8、心得
在本次实验中,我纠正了一个一直以来的概念错误:
main不是关键字,它定义为程序的入口,是主函数!
在本实验中,虽然我把main初始化在关键字表
(字符指针类型数组)*Key[10]中,当与该数组中字符串进行比较时,若与main匹配成功,则返回2,若为其他关键字则返回1,以此来把main从关键字中区别出来。
在本实验中的关键字表只初始化了几个常用的关键字,还可继续扩充(只需扩大数组,向其中补充要添加的关键字)。
如果要对本程序中未识别的c语言中的一些其他的字符进行扩充(目前处理为不可识别字符),可在程序代码中继续添加case选项,分别对相应要识别的特殊字符加以描述