最长公共子序列CS.docx

资源描述

最长公共子序列CS.docx

《最长公共子序列CS.docx》由会员分享，可在线阅读，更多相关《最长公共子序列CS.docx（11页珍藏版）》请在冰豆网上搜索。

最长公共子序列CS.docx

最长公共子序列CS

————————————————————————————————作者：

————————————————————————————————日期：

求解所有最长公共子序列

一、问题分析

该部分思路同课件

二、算法设计思路

根据问题分析的结果，具体的算法设计思路如下：

1）申明两个数组，用于保存比较的两个字符串；由于事先不知字符串大小，故动态的实现，这里用C++的容器。

2）申明全局变量，二维数组B和数组C。

数组C用于保存计算Xi和Yi的LCS值；数组B保存当前的C是从哪个子问题得来的。

为此，定义一个枚举类型，用于标识不同的方向，分别为对角线、向上、向左和向左向上四个方向。

3）根据动态规划，实现一个函数LCS_LENGTH，完成的功能是计算数组B和C。

具体过程是：

先是动态申请二维数组B和C，他们的行列长度都增加1，目的就是方便计算。

将C的第0行和第0列都赋上0，即初始化。

开始计算C[i][j]，以行为主，一次计算C的每一个元素，即将两个数组逐一比较。

比较时就有两种情况，分别是若相等时，就将C[i][j]设置成C[i-1][j-1]，同时将B[i][j]设置成DIAGONAL。

若不相等时，比较C[i-1][j]和C[i][j-1]的值，又有三种情况：

一是C[i-1][j]与C[i][j-1]相等，就随便把某一个赋给C[i][j]，比如C[i-1][j]，B[i][j]设置为UP_LEFT；二是若C[i-1][j]大于C[i][j-1]，则将C[i-1][j]赋给C[i][j]，并且将B[i][j]设置成UP；最后是若C[i-1][j]小于C[i][j-1]，则将C[i][j-1]赋给C[i][j]，并且将B[i][j]设置成LEFT。

4）根据第3）步骤的结果，就可以找出所有LCS了。

这里会用到回溯方法，具体实现可以用栈，也可以用递归。

本人使用的是递归，代码简单、易懂。

具体实现方法是：

申请一个数组用于保存一个LCS，这个数组会反复使用，因此，一旦找到一个就会立即将它输出。

再设置一个变量curpos标识当前的数组下标，一个变量len保存当前LCS数组的元素个数。

扫描二维数组B，从最后一个开始，判断B的值，有四种情况：

当B的值是UP时，就向上递归；当B的值是LEFT时，就向左递归；当B的值是向上或是向左时，这是存在两个选择，先左后上，或是先上后左；当B的值是对角线的时，此时LCS数组才保存当前的字符，len加1，继续沿对角线递归，递归完之后，len减1，回溯。

若len为LCS的长度时，就输出。

三、算法流程图

1.功能函数LCS_LENGTH的流程图

图1

2.功能函数Print_LCS的流程图

图2

四、测试结果

测试用例保存在LCS.in的文件中，如下图3：

图3

从图3中可以看出，有三组测试用例。

本程序运行的结果如图4所示：

图4

五、分析结果

从实验的三组测试用例可以看出：

第一组是课本上的例子，结果正确；第二组是个反例，没有公共子序列，结果也正确；第三组是生物的应用，即从某种生物上摘取的DNA序列，结果出现三个重复的序列。

其实算法是正确的，但是原比较的字符串中重复的字符比较多，如果对每个重复的字符标记不一样，那么所求的结果中不会出现相同的LCS。

这也是本实验中的不足——没有检验LCS重复性。

故实验中可以加入检测有无重复的LCS程序，但这并不是本实验的重点。

六、附录（源代码）

#include

usingnamespacestd;

int**C,**B;//C保存计算Xi和Yi的LCS值；B保存当前的C是从哪个子问题得来的

char*LCS;//保存一个最长公共子序列

intlen=0;//回溯时用到的统计保存LCS数组当前长度

enum{DIAGONAL,UP,LEFT,UP_LEFT};

//定义方向，分别是：

对角线、向上、向左和向左向上

/*LCS_LENGTH函数，求出数组C和B*/

voidLCS_LENGTH（vectorX,vectorY,intm,intn）//计算C

{

C=newint*[m];//动态分配二维数组

B=newint*[m];

for（inti=0;i

{

C[i]=newint[n];

B[i]=newint[n];

}

for（i=1;i

C[i][0]=0;

for（intj=0;j

C[0][j]=0;

for（i=1;i

{

for（j=1;j

{

if（X.at（i-1）==Y.at（j-1））//此下标与数组的下标差1，相等时

{

C[i][j]=C[i-1][j-1]+1;//左上角的LCS+1

B[i][j]=DIAGONAL;

}

else//不相等

{

if（C[i-1][j]==C[i][j-1]）//up和left

{

C[i][j]=C[i-1][j];

B[i][j]=UP_LEFT;

}

elseif（C[i-1][j]>C[i][j-1]）//up

{

C[i][j]=C[i-1][j];

B[i][j]=UP;

}

else//left

{

C[i][j]=C[i][j-1];

B[i][j]=LEFT;

}

/*Print_LCS函数，打印出所有的LCS*/

voidPrint_LCS（int**B,vectorX,inti,intj,intcurpos,intmaxLCS,ostream&out）

{

if（i>=0&&j>=0）

{

if（len==maxLCS）//已经找到一个LCS，则输出

{

for（intk=len-1;k>=0;k--）

out<

}

else

{

if（B[i][j]==DIAGONAL）//对角线

{

LCS[curpos]=X.at（i-1）;

len++;

Print_LCS（B,X,i-1,j-1,curpos+1,maxLCS,out）;

len--;//回溯

}

elseif（B[i][j]==UP）//向上

{

Print_LCS（B,X,i-1,j,curpos,maxLCS,out）;

}

elseif（B[i][j]==LEFT）//向左

{

Print_LCS（B,X,i,j-1,curpos,maxLCS,out）;

}

else//向上或向左

{

Print_LCS（B,X,i-1,j,curpos,maxLCS,out）;//向上

Print_LCS（B,X,i,j-1,curpos,maxLCS,out）;//向左

}

/*输出字符串*/

voidout（vector:

iteratorbeg,vector:

iteratorend）

{

while（beg!

=end）

cout<<*beg++;

cout<

}

intmain（）

{

chars;

vectorX,Y;

ifstreamfin（"LCS.in"）;//输入文件

//charX[MAXSIZE],Y[MAXSIZE];

intcount=0;//实验的测试组数

cout<<"ReadingthefileLCS.in..."<

if（fin==NULL）

{

cout<<"Readingfailed!

cout<<"Thereisnoinputfile!

cout<<"PleasemakeaiuputfileusenameLCS.inandinputstrings."<

}

else

{

cout<<"Readingsucceed!

fin>>count;

fin.get（s）;//过滤一个换行符

cout<<"Theseare"<

for（intz=1;z<=count;z++）

{

while（fin.get（s）&&s!

='\n'）

X.push_back（s）;

while（fin.get（s）&&s!

='\n'）

Y.push_back（s）;

cout<<"Thegroup"<

out（X.begin（）,X.end（））;

out（Y.begin（）,Y.end（））;

intm=X.size（）+1;

intn=Y.size（）+1;

LCS_LENGTH（X,Y,m,n）;

intmax=C[m-1][n-1];//保存LCS的长度

if（0==max）//没有最长公共子序列

{

cout<<"ThereisnoLongestCommonSubsequence!

\n"<

}

else

{

LCS=newchar[max];

cout<<"AlltheLongestCommonSubsequenceare:

Print_LCS（B,X,m-1,n-1,0,max,cout）;

cout<

for（inti=0;i

{

delete[]B[i];

delete[]C[i];

}

delete[]B;

delete[]C;

delete[]LCS;

}

X.clear（）;

Y.clear（）;

}//for

}

return0;

}

展开阅读全文