Cminus语言词法分析器实验报告doc.docx
《Cminus语言词法分析器实验报告doc.docx》由会员分享,可在线阅读,更多相关《Cminus语言词法分析器实验报告doc.docx(18页珍藏版)》请在冰豆网上搜索。
Cminus语言词法分析器实验报告doc
装
订
线
编译原理实验报告
题目:
C_minus语言词法分析器
学院计算机科学与技术
专业xxxxxxxxxxxxxxxx
学号xxxxxxxxxxxx
姓名xxxx
指导教师xxxx
20xx年xx月xx日
C_minus语言词法分析器
一、实验目的
1.理解词法分析器的设计方法:
利用DFA编写相应的程序。
2.掌握手工编写词法分析程序的方法。
3.复习熟悉以前学过的编程语言
4.通过实验了解编译器词法分析的工作原理
二、实验原理
1.文法的概念,DFA的表示方法。
2.词法分析程序的输出和输入:
词法分析程序的功能是读入源程序,输出单词符号。
单词符号是程序设计语言的比本语法符号,程序设计语言的单词符号一般分为如下几种:
关键字,标示符,常数,运算符,界符,单词的输出是二元式的形式,需要知道二元式的表示方法,把得到的二元式写入输出文件。
转化图如下:
源程序
词法分析程序
记号文件
3.熟悉单词的描述工具,如正规文法,正规式,以及知道正规文法和正规式的等价性以及他们之间的互相转化。
熟悉把正规文法转化为正规式,把正规式转化为NFA以及把NFA转为相应的DFA,最后再把DFA简化,DFA的状态转化为相应的子程序,最后得到词法分析器
4.C语言的基本语法。
三、实验要求
1、该个词法分析器要求至少能够识别以下几类单词:
关键字:
else if int return void while共6个,所有的关键字都是保留字,并且必须是小写;
标识符:
识别与C语言词法规定相一致的标识符,通过下列正则表达式定义:
ID = letter (letter | digit)*;
常数:
NUM = digit digit*(.digit digit* |ε)(e(+ | - |ε) digit digit* |ε),letter = a|..|z|A|..|Z|,digit = 0|..|9,包括整数,如123等;小数,如123.45等;科学计数法表示的常数,如1.23e3,2.3e-9等;
专用符号:
+ - * / < <= > >= == !
= = , ( ) [ ] { } /* */;
2、分析器的输入为由上述几类单词构成的程序,输出为该段程序的机内表示形式,即关键字、运算符、界限符变为其对应的机内符,常数使用二进制形式,标识符使用相应的标识符表指针表示。
3、词法分析器应当能够指出源程序中的词法错误,如不可识别的符号、错误的词法等。
四、实验结果(程序)及分析
#include
#include
#include
#define N 100
typedef struct {
char name[30];
int code;
int addr;
}token;//存储刚从文件中读取的字符
typedef struct {
char name[30];
int code;
}Keyword;
typedef struct {
char name[30];
int code;
int addr;
}symbol;
Keyword key[6]={{"else",1},{"if",2},{"int",3},{"return",4},{"void",5},{"where",6}};
char ch;//接受字符
FILE *source;//源文件
FILE *keytxt;//关键字输出文件
FILE *badgetxt;//标识符输出文件
FILE *othertxt;//其他单词输出文件
FILE *number;
int error_count;//错误的个数
int addr_count;//标识符表的指针
int lineof;//行号
token current;// 暂时存放读入的字符
token zancun;
symbol currentsymbol;
symbol symboltable[N];//标识符表
void error(int i);
void main() {
void scan();
error_count=0;
addr_count=0;
error_count=0;
lineof=0;
scan();
}
void scan() {
int i=0;
void iskeyword();//判断关键字
void isOthers() //判断其他单词
void output_1();//关键字输出文件
void output_2();//标识符输出文件
void output_others();//其他单词输出文件
void Iszhushi();
void isnumber();
if((source=fopen("Source.txt","r"))==NULL){ //打开源文件
printf("file open error/n");
exit(0);
}
if((keytxt=fopen("key.txt","w"))==NULL){ //打开关键字文件
printf("file open error/n");
exit(0);
}
if((badgetxt=fopen("badge.txt","w"))==NULL){ //打开标识符文件
printf("file open error/n");
exit(0);
}
if((othertxt=fopen("others.txt","w"))==NULL) {
printf("file open error\n");
exit(0);
}
if((number=fopen("number.txt","w"))==NULL) {
printf("file open error\n");
exit(0);
}
ch=fgetc(source);
while(ch!
=EOF) {
for(i=0;i<30;i++)
current.name[i]='\0';
if((ch>='a' && ch<='z') ||(ch>='A' && ch<='Z') || ch=='_' )
iskeyword();
if(ch=='\\')
Iszhushi();
if(ch>='0'&& ch<='9')
isnumber();
else
isOthers();
ch=fgetc(source);
}
fclose(source);
fclose(keytxt);
fclose(badgetxt);
fclose(othertxt);
fclose(number);
}
void iskeyword(){
int i=0,k=0,j=0;
int h=0;
while(((ch>='a') && (ch<='z')) ||((ch>='A') && (ch<='Z')) || ch=='_' || (ch>'0' && ch<'9')) {
current.name[i]=ch;
i++;
ch=fgetc(source);
}
zancun=current;
for(i=0;i<6;i++) {
for(j=0;j<30;j++) {
if(current.name[j]==key[i].name[j]){
h=0;
} else{
h=1;
break;
}
}
if(h==0)
break;
}
if(h==0){
current.code=key[i].code;
output_1();
} else{
strcpy(symboltable[addr_count].name,current.name);
symboltable[addr_count].code=10;
symboltable[addr_count].addr=addr_count;
addr_count++;
output_2();
}
}
void isOthers(){
char ch1;
int i;
for(i=0;i<30;i++)
current.name[i]='\0';
switch(ch){
case '+':
{
current.name[0]='+';
current.code=13;
current.addr=-1;
output_others();
break;
}
case '-':
{
current.name[0]='-';
current.code=14;
current.addr=-1;
output_others();
break;
}
case '*':
{
current.name[0]='*';
current.code=15;
current.addr=-1;
output_others();
break;
}
case '/':
{
current.name[0]='/';
current.code=16;
current.addr=-1;
output_others();
break;
}
case'<':
{
ch1=fgetc(source);
if(ch1=='='){
current.name[0]='<';
current.name[1]='=';
current.code=17;
output_others();
break;
} else{
fseek(source,-1,1);
current.name[0]='<';
current.code=18;
current.addr=-1;
output_others();
break;
}
}
case'>':
{
ch1=fgetc(source);
if(ch1=='='){
current.name[0]='>';
current.name[1]='=';
current.code=19;
output_others();
break;
}else{
fseek(source,-1,1);
current.name[0]='>';
current.code=20;
output_others();
break;
}
}
case'=':
{
ch1=fgetc(source);
if(ch1=='='){
current.name[0]='=';
current.name[1]='=';
current.code=21;
current.addr=-1;
output_others();
break;
}else {
current.name[0]='=';
current.code=22;
current.addr=-1;
output_others();
fseek(source,-1,1);
break;
}
}
case '!
':
{
ch1=fgetc(source);
if(ch1=='='){
current.name[0]='!
';
current.name[1]='=';
current.code=23;
current.addr=-1;
output_others();
break;
}else{
fseek(source,-1,1);
current.name[0]='!
';
current.code=24;
current.addr=-1;
output_others();
break;
}
}
case ';':
{
current.name[0]=';';
current.code=25;
current.addr=-1;
output_others();
break;
}
case ',':
{
current.name[0]=',';
current.code=26;
current.addr=-1;
output_others();
}
case '(':
{
int i=ftell(source);
char ch1=ch;
char ch2;
while(ch!
=')') {
ch=fgetc(source);
}
if(ch==')') {
current.name[0]=ch1;
current.name[1]=ch;
current.code=27;
current.addr=-1;
output_others();
fseek(source,i,0);
ch2=fgetc(source);
ch2=fgetc(source);
break;
}else{
error_count++;
error
(1);
fseek(source,i,0);
ch2=fgetc(source);
ch2=fgetc(source);
break;
}
}
case '{':
{
current.name[0]='{';
current.code=28;
current.addr=-1;
output_others();
break;
}
case '}':
{
current.name[0]='}';
current.code=28;
current.addr=-1;
output_others();
break;
}
case '[':
{
current.name[0]='[';
current.code=29;
current.addr=-1;
output_others();
break;
}
case ']':
{
current.name[0]=']';
current.code=29;
current.addr=-1;
output_others();
break;
}
case'10':
{
lineof++;
break;
}
}
}
void Iszhushi() {
char ch1;
ch1=ch;
ch=fgetc(source);
if(ch=='*') {
for(;;){
ch=fgetc(source);
if(ch==EOF) {
error
(2);
break;
}
if(ch=='*') {
ch1=ch;
ch=fgetc(source);
if(ch=='\\') {
ch=fgetc(source);
break;
}
}
}
}else{
error_count++;
error
(2);
}
}
void isnumber() {
int k=0;
void output_number();
while(ch>='0'&& ch<='9'){
current.name[k++]=ch;
ch=fgetc(source);
}
current.code=11;
output_number();
}
void output_1() {
printf("关键字:
<%s,%d>",current.name,current.code);
putchar(10);
fprintf(keytxt,"<%s,%d>",current.name,current.code);
}
void output_2() {
printf("标识符地址:
<%s,%d>",current.name,addr_count);
putchar(10);
fprintf(badgetxt,"<%s,%d>",current.name,addr_count);
}
void output_others() {
printf("其它单词:
<%s,%d>",current.name,current.code);
putchar(10); fprintf(othertxt,"<%s,%d>",current.name,current.code);
}
void error(int i) {
switch(i){
case 1:
printf("界符发生错误,发生在第%d行/n",lineof);
case 2:
printf("注释发生错误,发生在第%d行/n",lineof);
}
}
void output_number() {
printf("常数<%s,%d>\n",current.name,current.code);
fprintf(number,"<%s,%d>",current.name,current.code);
}
实验结果分析,程序运行结果截图:
关键字输出文件:
标识符输出文件:
数字的输出文件
其它单词输出文件: