《编译原理》语法分析器实验报告模板课程设计信安.docx
《《编译原理》语法分析器实验报告模板课程设计信安.docx》由会员分享,可在线阅读,更多相关《《编译原理》语法分析器实验报告模板课程设计信安.docx(31页珍藏版)》请在冰豆网上搜索。
《编译原理》语法分析器实验报告模板课程设计信安
课程设计报告
课程名称编译原理
实验项目设计与实现一个词法分析器
实验仪器PC机
北京信息科技大学
信息管理学院
(课程上机)实验报告
实验名称
设计与实现一个语法分析器
实验地点
信管机房204
实验时间
2011.12.20
1.实验目的:
结合讲授内容,进一步培养学生编译器设计的思想,加深对编译原理和应用程序的理解,针对编译过程的重点和难点内容进行编程,独立完成有一定工作量的语法分析程序设计任务,同时强调好的程序设计风格。
2.实验内容:
对输入的文法判定是否为LL
(1)文法,若是LL
(1)文法,则构造LL
(1)分析表,输入一个句子,依据LL
(1)分析表输出与句子对应的语法树。
设计LL
(1)文法的词法分析器。
3.实验要求:
(1)输入一个文法G(如:
测试数据1);
(2)编写求FIRST集的算法;输出文法G的First集;
(3)编写求FOLLOW集的算法;输出文法G的FOLLOW集;
(4)编写求SELECT的算法,输出文法G的SELECT集;
(5)判定是否为LL
(1)文法,若是,则编写构造LL
(1)分析表的算法,并输出预测分析表
(6)编写表驱动的预测分析算法;
(7)给出输入一个句子(如:
测试数据2)的预测分析步骤;
(8)输出依据句子构对应的语法树的过程;
(9)构造文法G的递归子程序;(选作)
测试数据1:
(若用其它测试数据,请替换下面内容)
输入文法G:
S->aH
H->aMd|d
M->Ab|@
A->aM|e
测试数据2:
输入句子:
aaabd#
4.实验准备:
5.实验过程:
#include
#include
#include
/*******************************************/
intcount=0;/*分解的产生式的个数*/
intnumber;/*所有终结符和非终结符的总数*/
charstart;/*开始符号*/
chartermin[50];/*终结符号*/
charnon_ter[50];/*非终结符号*/
charv[50];/*所有符号*/
charleft[50];/*左部*/
charright[50][50];/*右部*/
charfirst[50][50],follow[50][50];/*各产生式右部的FIRST和左部的FOLLOW集合*/
charfirst1[50][50];/*所有单个符号的FIRST集合*/
charselect[50][50];/*各单个产生式的SELECT集合*/
charf[50],F[50];/*记录各符号的FIRST和FOLLOW是否已求过*/
charempty[20];/*记录可直接推出@的符号*/
charTEMP[50];/*求FOLLOW时存放某一符号串的FIRST集合*/
intvalidity=1;/*表示输入文法是否有效*/
intll=1;/*表示输入文法是否为LL
(1)文法*/
intM[20][20];/*分析表*/
charchoose;/*用户输入时使用*/
charempt[20];/*求_emp()时使用*/
charfo[20];/*求FOLLOW集合时使用*/
/*******************************************
判断一个字符是否在指定字符串中
********************************************/
intin(charc,char*p)
{
inti;
if(strlen(p)==0)
return(0);
for(i=0;;i++)
{
if(p[i]==c)
return
(1);/*若在,返回1*/
if(i==strlen(p))
return(0);/*若不在,返回0*/
}
}
/*******************************************
得到一个不是非终结符的符号
********************************************/
charc()
{
charc='A';
while(in(c,non_ter)==1)
c++;
return(c);
}
/*******************************************
分解含有左递归的产生式
********************************************/
voidrecur(char*point)
{/*完整的产生式在point[]中*/
intj,m=0,n=3,k;
chartemp[20],ch;
ch=c();/*得到一个非终结符*/
k=strlen(non_ter);
non_ter[k]=ch;
non_ter[k+1]='\0';
for(j=0;j<=strlen(point)-1;j++)
{
if(point[n]==point[0])
{/*如果'|'后的首符号和左部相同*/
for(j=n+1;j<=strlen(point)-1;j++)
{
while(point[j]!
='|'&&point[j]!
='\0')
temp[m++]=point[j++];
left[count]=ch;
memcpy(right[count],temp,m);
right[count][m]=ch;
right[count][m+1]='\0';
m=0;
count++;
if(point[j]=='|')
{
n=j+1;
break;
}
}
}
else
{/*如果'|'后的首符号和左部不同*/
left[count]=ch;
right[count][0]='@';
right[count][1]='\0';
count++;
for(j=n;j<=strlen(point)-1;j++)
{
if(point[j]!
='|')
temp[m++]=point[j];
else
{
left[count]=point[0];
memcpy(right[count],temp,m);
right[count][m]=ch;
right[count][m+1]='\0';
printf("count=%d",count);
m=0;
count++;
}
}
left[count]=point[0];
memcpy(right[count],temp,m);
right[count][m]=ch;
right[count][m+1]='\0';
count++;
m=0;
}
}
}
voidnon_re(char*point)
{
intm=0,j;
chartemp[20];
for(j=3;j<=strlen(point)-1;j++)
{
if(point[j]!
='|')
temp[m++]=point[j];
else
{
left[count]=point[0];
memcpy(right[count],temp,m);
right[count][m]='\0';
m=0;
count++;
}
}
left[count]=point[0];
memcpy(right[count],temp,m);
right[count][m]='\0';
count++;
m=0;
}
/*******************************************
读入一个文法
********************************************/
chargrammer(char*t,char*n,char*left,charright[50][50])
{
charvn[50],vt[50];
chars;
charp[50][50];
inti,j,k;
printf("请输入文法的非终结符号串:
");
scanf("%s",vn);
getchar();
i=strlen(vn);
memcpy(n,vn,i);
n[i]='\0';
printf("请输入文法的终结符号串:
");
scanf("%s",vt);
getchar();
i=strlen(vt);
memcpy(t,vt,i);
t[i]='\0';
printf("请输入文法的开始符号:
");
scanf("%c",&s);
getchar();
printf("请输入文法产生式的条数:
");
scanf("%d",&i);
getchar();
for(j=0;j
{
printf("请输入文法的第%d条(共%d条)产生式:
",j,i);
scanf("%s",p[j]);//二维数组首地址传递平p,p[i]第i行第0列首地址,p+i表示第i行首地址
if(strcmp(p[j],"xxx")==0)//
{
j=j-2;
}
getchar();
}
for(j=0;j<=i-1;j++)
if(p[j][1]!
='-'||p[j][2]!
='>')
{printf("\ninputerror!
");
validity=0;
return('\0');
}/*检测输入错误*/
for(k=0;k<=i-1;k++)
{/*分解输入的各产生式*/
if(p[k][3]==p[k][0])
recur(p[k]);
else
non_re(p[k]);
}
return(s);
}
/*******************************************
将单个符号或符号串并入另一符号串
********************************************/
voidmerge(char*d,char*s,inttype)
{/*d是目标符号串,s是源串,type=1,源串中的'@'一并并入目串;
type=2,源串中的'@'不并入目串*/
inti,j;
for(i=0;i<=strlen(s)-1;i++)
{
if(type==2&&s[i]=='@')
;
else
{
for(j=0;;j++)
{
if(jbreak;
if(j==strlen(d))
{
d[j]=s[i];
d[j+1]='\0';
break;
}
}
}
}
}
/*******************************************
求所有能直接推出@的符号
********************************************/
voidemp(charc)
{/*即求所有由'@'推出的符号*/
chartemp[10];
inti;
for(i=0;i<=count-1;i++)
{
if(right[i][0]==c&&strlen(right[i])==1)
{
temp[0]=left[i];
temp[1]='\0';
merge(empty,temp,1);
emp(left[i]);//?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
}
}
}
/*******************************************
求某一符号能否推出'@'c为非终结符
********************************************/
int_emp(charc)
{/*若能推出,返回1;否则,返回0*/
inti,j,k,result=1,mark=0;
chartemp[20];
temp[0]=c;
temp[1]='\0';
merge(empt,temp,1);
if(in(c,empty)==1)
return
(1);
for(i=0;;i++)
{
if(i==count)
return(0);
if(left[i]==c)/*找一个左部为c的产生式*/
{
j=strlen(right[i]);/*j为右部的长度*/
if(j==1&&in(right[i][0],empty)==1)//A->BB->@
return
(1);
elseif(j==1&&in(right[i][0],termin)==1&&left[i+1]!
=c)//A->a,A->sB,S->@,B->@
return(0);
elseif(j==1&&in(right[i][0],termin)==1&&left[i+1]==c)
continue;
else
{
for(k=0;k<=j-1;k++)
if(in(right[i][k],empt)==1)//A->A
mark=1;
if(mark==1)
continue;
else
{
for(k=0;k<=j-1;k++)
{
result*=_emp(right[i][k]);//太漂亮了
temp[0]=right[i][k];
temp[1]='\0';
merge(empt,temp,1);
}
}
}
if(result==0&&iBa,A->S,S->@,B!
->@找下一个做不为@的---C
continue;
elseif(result==1&&ireturn
(1);
}
}
}
/*******************************************
判断读入的文法是否正确
********************************************/
intjudge()
{
inti,j;
for(i=0;i<=count-1;i++)
{
if(in(left[i],non_ter)==0)
{/*若左部不在非终结符中,报错*/
printf("\nerror1!
");
validity=0;
return(0);
}
for(j=0;j<=strlen(right[i])-1;j++)
{
if(in(right[i][j],non_ter)==0&&in(right[i][j],termin)==0&&right[i][j]!
='@')
{/*若右部某一符号不在非终结符、终结符中且不为'@',报错*/
printf("\nerror2!
");
validity=0;
return(0);
}
}
}
return
(1);
}
/*******************************************
求单个符号的FIRST求出每个符号的first并且将其存入first1[][]
********************************************/
voidfirst2(inti)
{/*i为符号在所有输入符号中的序号*/
charc,temp[20];
intj,k,m;
c=v[i];
charch='@';
emp(ch);
if(in(c,termin)==1)/*若为终结符*/
{
first1[i][0]=c;
first1[i][1]='\0';
}
elseif(in(c,non_ter)==1)/*若为非终结符*/
{
for(j=0;j<=count-1;j++)
{
if(left[j]==c)
{
if(in(right[j][0],termin)==1||right[j][0]=='@')//A->@或者A->a
{
temp[0]=right[j][0];
temp[1]='\0';
merge(first1[i],temp,1);
}
elseif(in(right[j][0],non_ter)==1)//左部非终结符并且右部为非终结符
{
if(right[j][0]==c)//A->A...寻找下一个A
continue;
for(k=0;;k++)//A->B。
无限循环,找到B的位置
if(v[k]==right[j][0])
break;
if(f[k]=='0')
{
first2(k);//M->A..此时找出A的位置在M之后,而A的first没有求过,所以要返回求
f[k]='1';
}
merge(first1[i],first1[k],2);//A->B则将B对应符号表位置找出,然后将Bfirst1[][]复制给A
for(k=0;k<=strlen(right[j])-1;k++)//二位数组strlen(right[j])表示第j行的长度
{
empt[0]='\0';
if(_emp(right[j][k])==1&&k{
for(m=0;;m++)
if(v[m]==right[j][k+1])//M->ABA->@则找到B的位置,求B的first
break;
if(f[m]=='0')
{
first2(m);
f[m]='1';
}
merge(first1[i],first1[m],2);
}
elseif(_emp(right[j][k])==1&&k==strlen(right[j])-1)
{
temp[0]='@';
temp[1]='\0';
merge(first1[i],temp,1);
}
else
break;
}
}
}
}
}
f[i]='1';
}
/*******************************************
求各产生式右部的FIRST
********************************************/
voidFIRST(inti,char*p)
{
intlength;
intj,k,m;
chartemp[20];
length=strlen(p);
if(length==1)/*如果右部为单个符号*/
{
if(p[0]=='@')
{
if(i>=0)
{
first[i][0]='@';
first[i][1]='\0';
}
else
{
TEMP[0]='@';
TEMP[1]='\0';
}
}
else
{
for(j=0;;j++)
if(v[j]==p[0])
break;
if(i>=0)
{
memcpy(first[i],first1[j],strlen(first1[j]));
first[i][strlen(first1[j])]='\0';
}
else
{
memcpy(TEMP,first1[j],strlen(first1[j]));
TEMP[strlen(first1[j])]='\0';
}
}
}
else/*如果右部为符号串*/
{
for(j=0;;j++)
if(v[j]==p[0])
break;
if(i>=0)
merge(first[i],first1[j],2);
else
merge(TEMP,first1[j],2);
for(k=0;k<=length-1;k++)
{
empt[0]='\0';
if(_emp(p[k])==1&&k{
for(m=0;;m++)
if(v[m]==right[i][k+1])
break;
if(i>=0)
merge(first[i],first1[m],2);
else
merge(TEMP,first1[m],2);
}
else