Cminus语言词法分析器实验报告.docx

上传人:b****5 文档编号:4544064 上传时间:2022-12-06 格式:DOCX 页数:17 大小:250.90KB
下载 相关 举报
Cminus语言词法分析器实验报告.docx_第1页
第1页 / 共17页
Cminus语言词法分析器实验报告.docx_第2页
第2页 / 共17页
Cminus语言词法分析器实验报告.docx_第3页
第3页 / 共17页
Cminus语言词法分析器实验报告.docx_第4页
第4页 / 共17页
Cminus语言词法分析器实验报告.docx_第5页
第5页 / 共17页
点击查看更多>>
下载资源
资源描述

Cminus语言词法分析器实验报告.docx

《Cminus语言词法分析器实验报告.docx》由会员分享,可在线阅读,更多相关《Cminus语言词法分析器实验报告.docx(17页珍藏版)》请在冰豆网上搜索。

Cminus语言词法分析器实验报告.docx

Cminus语言词法分析器实验报告

 

 

编译原理实验报告

题目:

C_minus语言词法分析器

 

学院计算机科学与技术

专业xxxxxxxxxxxxxxxx

学号xxxxxxxxxxxx

姓名xxxx

指导教师xxxx

20xx年xx月xx日

C_minus语言词法分析器

一、实验目的 

    1.理解词法分析器的设计方法:

利用DFA编写相应的程序。

 

2.掌握手工编写词法分析程序的方法。

     

3.复习熟悉以前学过的编程语言 

    4.通过实验了解编译器词法分析的工作原理 

 二、实验原理 

      1.文法的概念,DFA的表示方法。

         

      2.词法分析程序的输出和输入:

词法分析程序的功能是读入源程序,输出单词符号。

单词符号是程序设计语言的比本语法符号,程序设计语言的单词符号一般分为如下几种:

关键字,标示符,常数,运算符,界符,单词的输出是二元式的形式,需要知道二元式的表示方法,把得到的二元式写入输出文件。

   

转化图如下:

 

       

 

    3.熟悉单词的描述工具,如正规文法,正规式,以及知道正规文法和正规式的等价性以及他们之间的互相转化。

熟悉把正规文法转化为正规式,把正规式转化为NFA以及把NFA转为相应的DFA,最后再把DFA简化,DFA的状态转化为相应的子程序,最后得到词法分析器         

 

4.C语言的基本语法。

 

  三、实验要求 

 1、该个词法分析器要求至少能够识别以下几类单词:

 

关键字:

else if int return void while共6个,所有的关键字都是保留字,并且必须是小写; 

标识符:

识别与C语言词法规定相一致的标识符,通过下列正则表达式定义:

ID = letter (letter | digit)*; 

常数:

NUM = digit digit*(.digit digit* |ε)(e(+ | - |ε) digit digit* |ε),letter = a|..|z|A|..|Z|,digit = 0|..|9,包括整数,如123等;小数,如123.45等;科学计数法表示的常数,如1.23e3,2.3e-9等; 

专用符号:

+ - * / < <= > >= == !

= =  , ( ) [ ] { } /* */; 

2、分析器的输入为由上述几类单词构成的程序,输出为该段程序的机表示形式,即关键字、运算符、界限符变为其对应的机符,常数使用二进制形式,标识符使用相应的标识符表指针表示。

 

3、词法分析器应当能够指出源程序中的词法错误,如不可识别的符号、错误的词法等。

四、实验结果(程序)及分析  

#include 

#include

#include 

#define N 100 

typedef struct { 

 char name[30];

  int code; 

 int addr; 

}token;//存储刚从文件中读取的字符

typedef struct  {  

char name[30]; 

 int code; 

}Keyword; 

typedef struct { 

 char name[30]; 

 int code; 

 int addr;

}symbol; 

Keyword key[6]={{"else",1},{"if",2},{"int",3},{"return",4},{"void",5},{"where",6}}; 

char ch;//接受字符 

FILE *source;//源文件 

FILE *keytxt;//关键字输出文件 

FILE *badgetxt;//标识符输出文件 

FILE *othertxt;//其他单词输出文件 

FILE *number; 

int error_count;//错误的个数 

int addr_count;//标识符表的指针 

int lineof;//行号 

token current;//  暂时存放读入的字符 

token zancun;  

symbol currentsymbol; 

symbol symboltable[N];//标识符表

void error(int i); 

void main() {       

void scan();  

error_count=0; 

 addr_count=0;  

error_count=0; 

 lineof=0; 

 scan();

void scan() {  

int i=0; 

void iskeyword();//判断关键字

void isOthers() //判断其他单词 

void output_1();//关键字输出文件   

void output_2();//标识符输出文件 

void output_others();//其他单词输出文件

void Iszhushi();   

 void isnumber(); 

 if((source=fopen("Source.txt","r"))==NULL){   //打开源文件

printf("file open error/n");  

 exit(0);  

}   

if((keytxt=fopen("key.txt","w"))==NULL){   //打开关键字文件

printf("file open error/n");  

 exit(0); 

 }    

if((badgetxt=fopen("badge.txt","w"))==NULL){  //打开标识符文件

 printf("file open error/n");  

 exit(0); 

 } 

if((othertxt=fopen("others.txt","w"))==NULL) {  

 printf("file open error\n");  

 exit(0);

  }  

if((number=fopen("number.txt","w"))==NULL) { 

  printf("file open error\n");  

exit(0);

  } 

   ch=fgetc(source);  

  while(ch!

=EOF) {

     for(i=0;i<30;i++)

      current.name[i]='\0';

 if((ch>='a' && ch<='z') ||(ch>='A' && ch<='Z') || ch=='_' )

      iskeyword();     

if(ch=='\\') 

     Iszhushi(); 

    if(ch>='0'&& ch<='9') 

isnumber();     

else

       isOthers();    

 ch=fgetc(source);

    fclose(source);

     fclose(keytxt);

     fclose(badgetxt);

  fclose(othertxt);

  fclose(number); 

void iskeyword(){

  int i=0,k=0,j=0;

  int h=0; 

 while(((ch>='a') && (ch<='z')) ||((ch>='A') && (ch<='Z')) || ch=='_' || (ch>'0' && ch<'9')) { 

            current.name[i]=ch;

       i++; 

           ch=fgetc(source); 

  }

  zancun=current;

  for(i=0;i<6;i++) {    

for(j=0;j<30;j++)   { 

if(current.name[j]==key[i].name[j]){

     h=0;

} else{ 

    h=1;

    break;

}

 } 

 if(h==0) 

   break;  

 }

 if(h==0){

        current.code=key[i].code;

        output_1(); 

} else{ 

            strcpy(symboltable[addr_count].name,current.name);

         symboltable[addr_count].code=10;

          symboltable[addr_count].addr=addr_count;

      addr_count++;

      output_2(); 

  }

 } 

void isOthers(){

char ch1;

int i; 

      for(i=0;i<30;i++)

      current.name[i]='\0'; 

      switch(ch){ 

          case '+':

                 current.name[0]='+';

              current.code=13;

              current.addr=-1;

              output_others();

                 break;

        }           

case '-':

 {  

         current.name[0]='-';

           current.code=14;   

       current.addr=-1;    

       output_others();     

     break;  

}       

   case '*':

 {       

    current.name[0]='*'; 

          current.code=15;    

       current.addr=-1;  

        output_others();    

       break;   

 }       

   case '/':

{   

         current.name[0]='/'; 

 current.code=16;    

       current.addr=-1;     

       output_others();    

       break;    

 }       

   case'<':

{    

     ch1=fgetc(source);  

         if(ch1=='='){      

     current.name[0]='<';     

     current.name[1]='=';       

current.code=17;    

       output_others();   

            break;     

 } else{ 

  fseek(source,-1,1);    

        current.name[0]='<';      

      current.code=18;       

     current.addr=-1;         

   output_others();       

     break;    

 }    

  }     

  case'>':

 {

     ch1=fgetc(source);  

    if(ch1=='='){    

   current.name[0]='>'; 

      current.name[1]='=';   

    current.code=19;   

    output_others();   

    break;   

   }else{  

 fseek(source,-1,1); 

    current.name[0]='>';   

 current.code=20;    

output_others();  

   break;   

  }   

   } 

case'=':

 {

ch1=fgetc(source); 

if(ch1=='='){

current.name[0]='=';

current.name[1]='=';

current.code=21;

current.addr=-1;

output_others();

break;

}else {

current.name[0]='='; 

current.code=22; 

current.addr=-1; 

output_others(); 

fseek(source,-1,1);

break;

}

}

case '!

':

 {

ch1=fgetc(source); 

if(ch1=='='){

current.name[0]='!

';

current.name[1]='=';

current.code=23;

current.addr=-1;

output_others();

break;

}else{

fseek(source,-1,1); 

 current.name[0]='!

';

 current.code=24; 

current.addr=-1;

output_others();

break;

}

}

case ';':

 { 

current.name[0]=';'; 

current.code=25;  

current.addr=-1;

 output_others();     

 break;  

case ',':

 { 

current.name[0]=','; 

current.code=26;   

current.addr=-1;  

output_others();  

 }     

 case '(':

 {  

     int i=ftell(source);   

   char ch1=ch;  

   char ch2;  

   while(ch!

=')')  {  

  ch=fgetc(source); 

 }     

  if(ch==')') {  

  current.name[0]=ch1;  

  current.name[1]=ch; 

   current.code=27;  

  current.addr=-1;  

  output_others(); 

   fseek(source,i,0); 

   ch2=fgetc(source); 

   ch2=fgetc(source);  

  break;  

}else{

    error_count++;  

  error

(1); 

  fseek(source,i,0); 

  ch2=fgetc(source);

  ch2=fgetc(source); 

  break;  

  }

 }

  case '{':

current.name[0]='{'; 

 current.code=28;  

 current.addr=-1; 

output_others();  

 break;  

}

case '}':

current.name[0]='}';   

 current.code=28;   

 current.addr=-1;

 output_others();  

  break;  

}  

case '[':

          current.name[0]='[';   

    current.code=29; 

      current.addr=-1;  

      output_others();  

   break; 

}  

case ']':

 { 

          current.name[0]=']';

        current.code=29;   

     current.addr=-1;      

 output_others();

 break;  

}  

case'10':

 {

    lineof++; 

  break;

 }  

void Iszhushi() {  

char ch1;  

ch1=ch;

ch=fgetc(source);  

if(ch=='*') {   

for(;;){ 

ch=fgetc(source); 

 if(ch==EOF) { 

 error

(2);   

  break;  

if(ch=='*') {  

   ch1=ch;  

   ch=fgetc(source);   

  if(ch=='\\') {     

 ch=fgetc(source);    

  break;    

 }

}

}

}else{

error_count++;  

 error

(2);

void isnumber() {  

int k=0;  

void output_number(); 

 while(ch>='0'&& ch<='9'){  

 current.name[k++]=ch;  

ch=fgetc(source);

  }  

current.code=11; 

output_number(); 

void output_1() {

printf("关键字:

<%s,%d>",current.name,current.code);  

putchar(10);  

fprintf(keytxt,"<%s,%d>",current.name,current.code); 

void output_2() { 

    printf("标识符地址:

<%s,%d>",current.name,addr_count);   

  putchar(10); 

fprintf(badgetxt,"<%s,%d>",current.name,addr_count); 

void output_others() { 

 printf("其它单词:

<%s,%d>",current.name,current.code); 

 putchar(10);  fprintf(othertxt,"<%s,%d>",current.name,current.code);

void error(int i) {  

switch(i){  

case 1:

   printf("界符发生错误,发生在第%d行/n",lineof);  

case 2:

   printf("注释发生错误,发生在第%d行/n",lineof);  

void output_number() { 

printf("常数<%s,%d>\n",current.name,current.code);     

fprintf(number,"<%s,%d>",current.name,current.code);

 } 

实验结果分析,程序运行结果截图:

 

  

 

关键字输出文件:

 

 

标识符输出文件:

 

 

数字的输出文件 

 

 

其它单词输出文件:

 

 

 

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高中教育 > 高中教育

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1