实验一词法分析器含源代码.docx
《实验一词法分析器含源代码.docx》由会员分享,可在线阅读,更多相关《实验一词法分析器含源代码.docx(9页珍藏版)》请在冰豆网上搜索。
实验一词法分析器含源代码
词法分析器实验报告
一、实验目的及要求
本次实验通过用C语言设计、编制、调试一个词法分析子程序,识别单词,实现一个C语言词法分析器,经过此过程可以加深对编译器解析单词流的过程的了解。
运行环境:
硬件:
windowsxp
软件:
visualc++6.0
二、实验步骤
1.查询资料,了解词法分析器的工作过程与原理。
2.分析题目,整理出基本设计思路。
3.实践编码,将设计思想转换用c语言编码实现,编译运行。
4.测试功能,多次设置包含不同字符,关键字的待解析文件,仔细察看运行结果,检测该分析器的分析结果是否正确。
通过最终的测试发现问题,逐渐完善代码中设置的分析对象与关键字表,拓宽分析范围提高分析能力。
三、实验内容
本实验中将c语言单词符号分成了四类:
关键字key(特别的将main说明为主函数)、普通标示符、常数和界符。
将关键字初始化在一个字符型指针数组*key[]中,将界符分别由程序中的case列出。
在词法分析过程中,关键字表和case列出的界符的内容是固定不变的(由程序中的初始化确定),因此,从源文件字符串中识别出现的关键字,界符只能从其中选取。
标识符、常数是在分析过程中不断形成的。
对于一个具体源程序而言,在扫描字符串时识别出一个单词,若这个单词的类型是关键字、普通标示符、常数或界符中之一,那么就将此单词以文字说明的形式输出.每次调用词法分析程序,它均能自动继续扫描下去,形成下一个单词,直到整个源程序全部扫描完毕,从而形成相应的单词串。
输出形式例如:
void$关键字
流程图、程序
流程图:
程序:
#include
#include
#include
#include
//定义关键字
char*Key[10]={"main","void","int","char","printf","scanf","else","if","return"};
charWord[20],ch;//存储识别出的单词流
intIsAlpha(charc){//判断是否为字母
if(((c<='z')&&(c>='a'))||((c<='Z')&&(c>='A')))return1;
elsereturn0;
}
intIsNum(charc){//判断是否为数字
if(c>='0'&&c<='9')return1;
elsereturn0;
}
intIsKey(char*Word){//识别关键字函数
intm,i;
for(i=0;i<9;i++){
if((m=strcmp(Word,Key[i]))==0)
{
if(i==0)
return2;
return1;
}
}
return0;
}
voidscanner(FILE*fp){//扫描函数
charWord[20]={'\0'};
charch;
inti,c;
ch=fgetc(fp);//获取字符,指针fp并自动指向下一个字符
if(IsAlpha(ch)){//判断该字符是否是字母
Word[0]=ch;
ch=fgetc(fp);
i=1;
while(IsNum(ch)||IsAlpha(ch)){//判断该字符是否是字母或数字
Word[i]=ch;
i++;
ch=fgetc(fp);
}
Word[i]='\0';//'\0'代表字符结束(空格)
fseek(fp,-1,1);//回退一个字符
c=IsKey(Word);//判断是否是关键字
if(c==0)printf("%s\t$普通标识符\n\n",Word);//不是关键字
elseif(c==2)printf("%s\t$主函数\n\n",Word);
elseprintf("%s\t$关键字\n\n",Word);//输出关键字
}
else//开始判断的字符不是字母
if(IsNum(ch)){//判断是否是数字
Word[0]=ch;
ch=fgetc(fp);
i=1;
while(IsNum(ch)){
Word[i]=ch;
i++;
ch=fgetc(fp);
}
Word[i]='\0';
fseek(fp,-1,1);//回退
printf("%s\t$无符号实数\n\n",Word);
}
else//开始判断的字符不是字母也不是数字
{
Word[0]=ch;
switch(ch){
case'[':
case']':
case'(':
case')':
case'{':
case'}':
case',':
case'"':
case';':
printf("%s\t$界符\n\n",Word);break;
case'+':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){
printf("%s\t$运算符\n\n",Word);//运算符“+=”
}
elseif(ch=='+'){
printf("%s\t$运算符\n\n",Word);//判断结果为“++”
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);//判断结果为“+”
}
break;
case'-':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){
printf("%s\t$运算符\n\n",Word);}
elseif(ch=='-'){
printf("%s\t$运算符\n\n",Word);//判断结果为“--”
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);//判断结果为“-”
}
break;
case'*':
case'/':
case'!
':
case'=':
ch=fgetc(fp);
if(ch=='='){
printf("%s\t$运算符\n\n",Word);
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);
}
break;
case'<':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){
printf("%s\t$运算符\n\n",Word);//判断结果为运算符“<=”
}
elseif(ch=='<'){
printf("%s\t$运算符\n\n",Word);//判断结果为“<<”
}
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);//判断结果为“<”
}
break;
case'>':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='=')printf("%s\t$运算符\n\n",Word);
else{
fseek(fp,-1,1);
printf("%s\t$运算符\n\n",Word);
}
break;
case'%':
ch=fgetc(fp);
Word[1]=ch;
if(ch=='='){printf("%s\t$运算符\n\n",Word);}
if(IsAlpha(ch))printf("%s\t$类型标识符\n\n",Word);
else{
fseek(fp,-1,1);
printf("%s\t$取余运算符\n\n",Word);
}
break;
default:
printf("无法识别字符!
\n\n");break;
}
}
}
main()
{
charin_fn[30];//文件路径
FILE*fp;
printf("\n请输入源文件名(包括路径和后缀名):
");
while
(1){
gets(in_fn);
//scanf("%s",in_fn);
if((fp=fopen(in_fn,"r"))!
=NULL)break;//读取文件内容,并返回文件指针,该指针指向文件的第一个字符
elseprintf("文件路径错误!
请重新输入:
");
}
printf("\n*******************词法分析结果如下*******************\n");
do{
ch=fgetc(fp);
if(ch=='#')break;//文件以#结尾,作为扫描结束条件
elseif(ch==''||ch=='\t'||ch=='\n'){}//忽略空格,空白,和换行
else{
fseek(fp,-1,1);//回退一个字节开始识别单词流
scanner(fp);
}
}while(ch!
='#');
return(0);
}
4.实验结果
解析源文件:
voidmain()
{
inta=3;
a+=b;
printf("%d",a);
return;
}
#
解析结果:
5.实验总结分析
通过本次实验,让再次浏览了有关c语言的一些基本知识,特别是对文件,字符串进行基本操作的方法。
C语言中没有string类型,因此本实验中的对字符串提取与识别均借助#include及字符型数组来实现。
让我练习对字符串函数应用的同时也提高了自己的逻辑思维能力。
在本次实验中,我纠正了一个一直以来的概念错误:
main不是关键字,它定义为程序的入口,是主函数!
在本实验中,虽然我把main初始化在关键字表
(字符指针类型数组)*Key[10]中,当与该数组中字符串进行比较时,若与main匹配成功,则返回2,若为其他关键字则返回1,以此来把main从关键字中区别出来。
在本实验中的关键字表只初始化了几个常用的关键字,还可继续扩充(只需扩大数组,向其中补充要添加的关键字)。
如果要对本程序中未识别的c语言中的一些其他的字符进行扩充(目前处理为不可识别字符),可在程序代码中继续添加case选项,分别对相应要识别的特殊字符加以描述
THANKS!
!
!
致力为企业和个人提供合同协议,策划案计划书,学习课件等等
打造全网一站式需求
欢迎您的下载,资料仅供参考