编译原理词法分析程序实验报告Word文件下载.docx

资源描述

编译原理词法分析程序实验报告Word文件下载.docx

《编译原理词法分析程序实验报告Word文件下载.docx》由会员分享，可在线阅读，更多相关《编译原理词法分析程序实验报告Word文件下载.docx（13页珍藏版）》请在冰豆网上搜索。

编译原理词法分析程序实验报告Word文件下载.docx

2.掌握正则文法和正则表达式转换成有穷自动机的方法及有穷自动机实现的方法

3.确定词法分析程序的输出形式及标识符与关键字的区分方法

4.加深对理论知识的理解

二、实验设计

1.设计原理：

对源程序代码从头到尾扫描，将符合词法语言规则的单词输出，包括：

标识符、保留字、无符号整数、分界符、运算符、注释分离；

判断程序的词法是否正确

TEST语言的词法规则如下：

1）、标识符：

字母打头，后接任意字母或数字。

2）、保留字：

标识符的子集，包括：

if,else,for,while,do,int,write,read。

3）、无符号整数：

由数字组成，但最高位不能为0，允许一位的0。

4）、分界符：

（、）、;

、{、}

5）、运算符：

+、-、*、/、=、<

、>

=、<

=、!

=、==

6）、注释符：

/**/

2.设计方法：

1）用正则表达式或正则文法描述程序设计语言的词法规则，通常采用正则表达式；

一个正则表达式对应一条词法规则

2）为每个正则表达式构造一个NFA，用来识别正则表达式描述的单词将每一个NFA合并、化简得到最简的DFA

3）将多个NFA合并为一个NFA

4）将NFA转换成等价的DFA。

5）最小化DFA

6）确定单词的输出形式。

7）化简后的DFA＋单词输出形式⇒构造词法分析程序

3.设计过程：

1）将TEST语言的六个语法规则分别转换成正则表达式

2）为每个正则表达式构造一个NFA，用来识别正则表达式描述的单词

3）将5个NFA转换成一个NFA，再将NFA化简确定化。

4.设计结果：

1）每一条TEST语言对应的正则表达式如下：

标识符：

（a|b|……|z|A|B……|Z）（0|1|……|9|a|b|……|z|A|B……|Z）*

保留字：

标识符的子集

无符号整数：

（（1……|9）（0|1|……|9）*）|0

分界符：

（|）|;

|{|}

运算符：

+|-|*|/|=|<

=|<

=|!

=|==

注释符：

/*（其他）*/

2）NFA如图

3）化简、确定化的DFA

三、实验过程

1.将TEST语言的六个语法规则转换成正则表达式

2.将每个正则表达式装换成NFA,再将NFA合并化简

3.最终得到设计结果如上所示：

4.根据确定化的DFA编写代码

5.测试实验数据

三、实验结果

1.测试数据：

{

/*Thisatestprogram.*/

intabc;

int123;

intA$@;

inti;

intn;

intb,c;

int2a;

inta2;

readn;

n=012345;

for（i=1;

=n;

i=i+1）

{

abc=abc+i;

}

if（i!

=n）n=n+i;

if（!

n）b=b+c;

/*Theloopended

writeabc;

2.实验现象：

a）控制台显示的数据：

b）输出文本的数据：

{{

intint

IDabc

;

NUM123

IDA

Error$

Error@

IDi

IDn

IDb

Error,

IDc

NUM2

IDa

IDa2

readread

NUM0

NUM12345

forfor

（（

NUM1

））

}}

ifif

Error!

c）数据分析：

根据TEST语法规则，我们可以知道

这一句中的$和@是不合法的

这一句中的逗号是不合法的

这一句中!

是不合法的

/*Theloopended这一句都是不合法的

四、讨论与分析

单词分类方法：

按照标识符、数字、分解符、注释符、运算符分类；

其中需要注意的是（>

=）可以直接结束，也可以连接=，！

必须与=连接才合法，对于/需要多重考虑，即在注释这个部分也可能是/符号

构建词法分析程序的一般过程：

、

1、根据词法规则写出正则文法或者正则文法。

2、为每一个正则表达式构造一个NFA，然后将多个NFA合并为一个NFA

3、将NFA转化成DFA，并且化简最小化DFA

4、确定单词的输出形式

5、根据化简后的DFA和单词输出程序构造词法分析程序

五、附录：

关键代码

//开始读取文件中的字符

ch=getc（fin）;

while（ch!

=EOF）

{

i=0;

while（ch=='

||ch=='

\n'

\t'

）

if（ch=='

line++;

}

//标识符处理

if（isalpha（ch））

while（isalpha（ch）||isdigit（ch））

buff[i++]=ch;

buff[i]='

\0'

//保留字

intn=0;

while（（n<

8）&

strcmp（buff,keyword[n]））

n++;

if（n<

8）

fprintf（fout,"

%s\t%s\n"

buff）;

else

ID"

//数字处理

elseif（isdigit（ch））

//单个数字“0”

buff[0]=ch;

buff[1]='

NUM"

//数字的组合

while（isdigit（ch））

//单分界符

elseif（strchr（singleword,ch）>

0）

buff,buff）;

//双分界符

elseif（strchr（doubleword,ch）>

buff[1]=ch;

buff[2]='

if（buff[0]=='

printf（"

Line%d\t%s\t%s\n"

line,"

错误：

Error"

//注释

elseif（ch=='

charch1=getc（fin）;

while（true）

if（ch1==EOF）

Line%d\t%s\t没有匹配！

\n"

line,"

错误:

）;

break;

ch=ch1;

ch1=getc（fin）;

if（ch=='

ch1=='

buff[0]='

//输出单分界符'

flag=3;

ch=getc（fin）;

line,"

buff）;

fclose（fin）;

fclose（fout）;

returnflag;

展开阅读全文