编译实验三NFA转换成DFA和DFA化简要点.docx

资源描述

编译实验三NFA转换成DFA和DFA化简要点.docx

《编译实验三NFA转换成DFA和DFA化简要点.docx》由会员分享，可在线阅读，更多相关《编译实验三NFA转换成DFA和DFA化简要点.docx（17页珍藏版）》请在冰豆网上搜索。

编译实验三NFA转换成DFA和DFA化简要点.docx

编译实验三NFA转换成DFA和DFA化简要点

实验三

（一）NFA→DFA（2小时）

一.问题描述

NFA→DFA。

1.实验目的：

学会编程实现子集构造法。

2.实验任务：

存储NFA与DFA，编程实现子集构造法将NFA转换成DFA。

3.实验内容：

（1）确定NFA与DFA的存储格式，为3个以上测试NFA准备好存储文件。

（2）用C或JAVA语言编写将NFA转换成DFA的子集构造法的程序。

（3）经测试无误。

测试不易。

可求出NFA与DFA的语言集合的某个子集（如长度小于某个N），再证实两个语言集合完全相同！

（4）测试用例参考：

将下列语言用RE表示，再转换成NFA使用：

（a）以a开头和结尾的小字字母串；a（a|b|…|z）*a|a

（b）不包含三个连续的b的，由字母a与b组成的字符串；（ε|b|bb）（a|ab|abb）*

（c）（aa|b）*（a|bb）*

二．算法描述

1.NFA的输入：

分别输入NFA的“字符集”、“状态集”、“开始状态”、“接受状态集”、“状态转换表”等内容，并保存在设定的变量中。

2.NFA的存储与读写：

将上述NFA的五元组保存在一个文本文件中。

存储格式如下所示（以下图中NFA为例）：

2//字符集中的字符个数（以下两行也可合并成一行）

ab//以空格分隔的字符集。

4//状态个数（以下两行也可合并成一行）

1234//状态编号。

若约定总是用从1开始的连续数字表示，则此行可省略

1//开始状态的编号。

若约定为1，则此行可省略

1//结束状态个数。

若约定为1，则此行可省略

3//结束状态的编号

321//状态1的所有出去的转换。

按字符集中的字符顺序给出，并在最左边加上一列关于ε的转换。

-1表示出错状态。

多个状态用逗号分隔。

-11-1

-134

-1-13

3.基本算法描述

存储格式如上所示，程序开始时，从文件中读取数据以获得NFA中的各种信息。

根据子集构造法，构造相应的函数。

子集构造法伪代码如下：

初始时, ε-closure（S0）是 Dstates 中唯一的状态且未被标记;

while Dstates 中存在一个未标记的状态T do begin

标记T;

for 每个输入符号 a do begin

U :

= ε-closure （ move （T, a））;

if U 没在Dstates中 then

将U作为一个未被标记的状态添加到 Dstates.

Dtran [ T, a ] :

= U

end

ε-closure 的计算

将T中所有状态压入栈stack;

将ε-closure （T）初始化为T;

while stack不空 do begin

将栈顶元素t弹出栈;

for 每个这样的状态u：

从t到u有一条标记为 ε的边do

if u 不在ε-closure （ T ）中 do begin

将u 添加到ε-closure （ T ）;

将u压入栈stack中

end

子集构造法的流程图：

实验三

（二）DFA化简（2小时）

一.问题描述

DFA化简

1．实验目的：

学会编程实现等价划分法化简DFA。

2．实验任务：

先完善DFA，再化简DFA。

3．实验内容：

（1）准备3个以上测试DFA文件。

（2）DFA手动完善。

（状态转换映射要是满映射）

（3）用C或JAVA语言编写用等价划分法化简DFA的程序。

（4）经测试无误。

测试不易。

可求出两个DFA的语言集合的某个子集（如长度小于某个N），再证实两个语言集合完全相同！

（5）编写实验报告。

要求同实验一，不再详述。

二．算法描述

1. DFA的化简

得到新的DFA之后，并没有完成任务，因为通过NFA转化成DFA不一定是最简的，也就是说，有多余的状态可以被删除，而我们需要的是得到一个唯一的最简的DFA[12]，也就是说，NFA转化为DFA之后，还需要化简，也就是最小化。

2.化简的理论基础

DFA的化简是指：

寻找一个状态数最少的DFA M，使得L（M）=L（M’）。

化简的方法是消去DFA M中的多余状态（或无用状态），合并等价状态。

DFA中的多余状态是指这样的状态：

从开始状态出发，读入任何输入串都不能到达的那个状态；或者从这个状态没有通路到达终态。

两个状态S 和T等价是指：

如果从状态S出发能读出某个字W而停于终态，从T出发也能读出同样的字W而停于终态；反之，从T出发能读出同样的字W而停于终态，从S出发也能读出某个字W而停于终态。

3.化简的基本思想

化简DFA的基本思想是指导它的状态分成一些互不相交的子集，每一个子集中的状态都不是等价的，不同子集中的状态可以由某个输入串来区别，最后将不能区别的每个子集用一个状态来做代表[13-15]，这种方法称为“分割法”。

具体过程是：

（1）将M的所有状态分成两个子集——终态集和非终态集；

（2）考察每一个子集，若发现某子集中的状态不等价，将其划分为两个集合；

（3）重复第

（2）步，继续考察已得到的每一个子集，直到没有任何一个子集需要继续划分为止。

这时DFA的状态被分成若干个互不相交的子集。

（4）从每个子集中选出一个状态做代表即可得到最简的DFA。

三．程序分析

通过本设计所要求达到的目的是：

充分理解和掌握NFA，DFA以及NFA确定化过程的相关概念和知识，理解和掌握子集法的相关知识和应用，现在需要编程实现对输入NFA转换成DFA输出的功能。

程序总框图如下：

功能图如下：

4．运行结果

5.实验问题及心得

通过此次对从NFA到DFA的转化和DFA的化简的设计，使我更好的理解了NFA确定化过程的相关知识，很好的理解了子集法的演算过程。

还有DFA的化简过程有了更好地理解。

经过多次试验，在正确输入相关数据的情况下，程序能正常运行，当错误操作或输入错误数据时，程序将应错误自动关闭。

经过这次课程设计,也让我深刻的认识到实践才是最重要的。

书本只能教给我们基础知识,要怎样运用,将那些知识真正吸收,转化为自己的智慧,只有通过实践才能达到。

编译原理是一门实用性很强，对我们的专业很有帮助的科目,我将会继续努力,不断增加自己的知识面,把编译原理学习的更好。

6.附录

#include

#defineMAXS100

usingnamespacestd;

stringNODE;//结点集合

stringCHANGE;//终结符集合

intN;//NFA边数

structedge

{

stringfirst;

stringchange;

stringlast;

};

structchan

{

stringltab;

stringjihe[MAXS];

};

voidkong（inta）

{

inti;

for（i=0;i

cout<<'';

}

//排序

voidpaixu（string&a）

{

inti,j;

charb;

for（j=0;j

for（i=0;i

if（NODE.find（a[i]）>NODE.find（a[i+1]））

{

b=a[i];

a[i]=a[i+1];

a[i+1]=b;

}

voideclouse（charc,string&he,edgeb[]）

{

intk;

for（k=0;k

{

if（c==b[k].first[0]）

if（b[k].change=="*"）

{

if（he.find（b[k].last）>he.length（））

he+=b[k].last;

eclouse（b[k].last[0],he,b）;

}

voidmove（chan&he,intm,edgeb[]）

{

inti,j,k,l;

k=he.ltab.length（）;

l=he.jihe[m].length（）;

for（i=0;i

for（j=0;j

if（（CHANGE[m]==b[j].change[0]）&&（he.ltab[i]==b[j].first[0]））

if（he.jihe[m].find（b[j].last[0]）>he.jihe[m].length（））

he.jihe[m]+=b[j].last[0];

for（i=0;i

for（j=0;j

if（（CHANGE[m]==b[j].change[0]）&&（he.jihe[m][i]==b[j].first[0]））

if（he.jihe[m].find（b[j].last[0]）>he.jihe[m].length（））

he.jihe[m]+=b[j].last[0];

}

//输出

voidoutputfa（intlen,inth,chan*t）

{

inti,j,m;

cout<<"I";

for（i=0;i

cout<<'I'<

cout<

for（i=0;i

{

cout<<''<

m=t[i].ltab.length（）;

for（j=0;j

{

kong（8-m）;

m=t[i].jihe[j].length（）;

cout<

}

cout<

}

voidmain（）

{

edge*b=newedge[MAXS];

inti,j,k,m,n,h,x,y,len;

boolflag;

stringjh[MAXS],endnode,ednode,sta;

cout<<"请输入NFA各边信息（起点条件[空为*]终点），以#结束：

for（i=0;i

{

cin>>b[i].first;

if（b[i].first=="#"）

break;

cin>>b[i].change>>b[i].last;

}

N=i;

/*for（j=0;j

cout<

for（i=0;i

{

if（NODE.find（b[i].first）>NODE.length（））

NODE+=b[i].first;

if（NODE.find（b[i].last）>NODE.length（））

NODE+=b[i].last;

if（（CHANGE.find（b[i].change）>CHANGE.length（））&&（b[i].change!

="*"））

CHANGE+=b[i].change;

}

len=CHANGE.length（）;

cout<<"结点中属于终态的是：

cin>>endnode;

for（i=0;i

if（NODE.find（endnode[i]）>NODE.length（））

{

cout<<"所输终态不在集合中，错误！

return;

}

//cout<<"endnode="<

chan*t=newchan[MAXS];

t[0].ltab=b[0].first;

h=1;

eclouse（b[0].first[0],t[0].ltab,b）;//求e-clouse

//cout<

for（i=0;i

{

for（j=0;j

for（m=0;m

eclouse（t[i].ltab[j],t[i].jihe[m],b）;//求e-clouse

for（k=0;k

{

//cout<";

move（t[i],k,b）;//求move（I,a）

//cout<

for（j=0;j

eclouse（t[i].jihe[k][j],t[i].jihe[k],b）;//求e-clouse

}

for（j=0;j

{

paixu（t[i].jihe[j]）;//对集合排序以便比较

for（k=0;k

{

flag=operator==（t[k].ltab,t[i].jihe[j]）;

if（flag）

break;

}

if（!

flag&&t[i].jihe[j].length（））

t[h++].ltab=t[i].jihe[j];

}

cout<

outputfa（len,h,t）;//输出状态转换矩阵

//状态重新命名

string*d=newstring[h];

NODE.erase（）;

cout<

for（i=0;i

{

sta=t[i].ltab;

t[i].ltab.erase（）;

t[i].ltab='A'+i;

NODE+=t[i].ltab;

cout<<'{'<

for（j=0;j

if（sta.find（endnode[j]）

d[1]=ednode+=t[i].ltab;

for（k=0;k

for（m=0;m

if（sta==t[k].jihe[m]）

t[k].jihe[m]=t[i].ltab;

}

for（i=0;i

if（ednode.find（NODE[i]）>ednode.length（））

d[0]+=NODE[i];

endnode=ednode;

cout<

outputfa（len,h,t）;

//输出DFA

cout<<"其中终态为：

m=2;

sta.erase（）;

flag=0;

for（i=0;i

{

//cout<<"d["<

for（k=0;k

{

//cout<<"I"<

y=m;

for（j=0;j

{

for（n=0;n

{

if（d[n].find（t[NODE.find（d[i][j]）].jihe[k]）

{

if（t[NODE.find（d[i][j]）].jihe[k].length（）==0）

x=m;

else

x=n;

if（!

sta.length（））

{

sta+=x+48;

}

else

if（sta[0]!

=x+48）

{

d[m]+=d[i][j];

flag=1;

d[i].erase（j,1）;

//cout<

j--;

}

break;

//跳出n

}

}//n

}//j

if（flag）

{

m++;flag=0;

}

//cout<<"sta="<

sta.erase（）;

}//k

}//i

cout<

for（i=0;i

cout<<"{"<

cout<

//状态重新命名

chan*md=newchan[m];

NODE.erase（）;

cout<

for（i=0;i

{

md[i].ltab='A'+i;

NODE+=md[i].ltab;

cout<<"{"<

}

for（i=0;i

for（k=0;k

for（j=0;j

{

if（d[i][0]==t[j].ltab[0]）

{

for（n=0;n

{

if（!

t[j].jihe[k].length（））

break;

elseif（d[n].find（t[j].jihe[k]）

{

md[i].jihe[k]=md[n].ltab;

break;

}

break;

}

ednode.erase（）;

for（i=0;i

for（j=0;j

if（d[i].find（endnode[j]）

ednode+=md[i].ltab;

endnode=ednode;

cout<

outputfa（len,m,md）;

cout<<"其中终态为：

}

展开阅读全文